본문 바로가기

Programming/CUDA Programming

(2)
강력한 수준의 경량 프로파일러 Nvprof 강력한 수준의 경량 프로파일러 Nvprof 공헌자(저자/번역자): Mark Harris / NVIDIA Korea CUDA 5의 CUDA 툴킷에 nvprof라는 강력한 새 도구가 추가됐습니다! Nvprof는 진행 상황을 빠르게 검사, 작성 언어와 관계없이 NVIDIA GPU에서 실행되는 모든 CUDA 커널을 프로파일링 등 매우 편리한 도구입니다. Nvprof의 다양한 기능을 개발자 블로그에서 확인가능합니다. 링크: https://developer.nvidia.com/ko-kr/blog/cuda-%EC%A0%84%EB%AC%B8%EA%B0%80-%ED%8C%81-%EC%9C%A0%EC%9A%A9%ED%95%9C-%EB%B2%94%EC%9A%A9-gpu-%ED%94%84%EB%A1%9C%ED%8C%8C%EC..
CUDA의 데이터 처리 흐름 이해하기 1. CUDA의 데이터 처리 1.1 CUDA의 데이터 흐름 CUDA는 뛰어난 그래픽 카드의 연산 능력을 이용하여 처리하는 방법이다. 기존의 CPU처리 방법에 더 추가해야 하는 과정이 있다. 추가된 과정은 PC의 메모리에 있는 입력 데이터를 그래픽 카드의 메모리로 전달하고 GPU가 처리한 결과를 다시 그래픽 카드의 메모리에서 PC의 메모리로 가져오는 과정이다. CUDA의 데이터 흐름으로 (1) 그래픽 카드 메모리 공간을 할당한다. (2) PC의 입력 데이터를 그래픽 카드의 메모리로 복사한다. (3) 강력한 GPU성능을 이용하여 병렬처리한다. (4) 처리된 결과를 그래픽 카드의 메모리에서 PC의 메모리로 복사한다. 그러면 그래픽 카드에 메모리 공간을 할당하고 데이터를 복사하는 방법을 알아보자. 1.2 그래픽..