CUDA

System I/O 는 마더보드의 특성을 따르기 때문에 마더보드의 속도도 매우 중요하다. (보틀렉이 생기는 주요 부분)

GPU 칩 안에 멀티 프로세서가 여러개가 있을수 있고 하나가 있을 수 있다. 하나의 멀티 프로세서 안에는 SP라는 코어가 있다. Single precision 연산을 할 수 있는데 멀티 코어 하나에 8개의 코어각 존제 한다.

하나의 멀티 프로세서의 레지스터를 공유하게 된다. SP에 존재하는게 아니라 멀티프로세서 위쪽에 있다고 보면 된다.

Active Block은 맥시멈이 8이다. 하드웨어 스케쥴러에서 컴파일 될때 결정됨. 하나의 멀티 프로세서 안에서 레지스터와 쉐어 메모리를 사용하는 결정이 있는데 그걸 결정을 해주고. …..

G<<<M. N >>>
블락이 분기가 되고

블락 분기 안에서 쓰레드가 다시 분기가 된다.

Leave a Reply