엔비디아 타이탄 XP는 컷칩이 맞군요
지금까지 저도 타이탄 X가 테슬라 P100과 같은 개수의 쿠다 코어 개수를 가지고 있어 풀칩 버전의 GP102는 3584개의 쿠다 코어를 가지고 있다고 착각했습니다. 허나 결론적으로 쿼드로 라인업을 살펴보니 그게 아니었습니다. 잘못된 정보를 퍼뜨린 점 죄송합니다.
각 라인업의 현재 혹은 근래에 출시될 플래그십 모델들인데, 파스칼 쿼드로 P6000이 GP102의 풀 버전이라 3840개의 쿠다 코어를 내장해서 발매될 것이고 (올해 10월) 타이탄 X는 3584개의 쿠다코어만 존재해 컷칩이 맞습니다. 256개가 모자라니 대략 6% 정도 비활성화 한 셈이죠.
개인적으로는 타이탄 XP의 딥러닝 관련 연산이라는 INT8의 정체에 대해 굉장히 궁금하고, 1080Ti의 존재와 정체와 성능에 대해 굉장히 궁금합니다. DG님이 빨리 일했으면 좋겠습니다.
- 2019-07-26 10:16 이야기 > 좀비랜드 2 예고편 *1
- 2019-07-11 01:51 이야기 > 결국 질렀습니다 *18
- 2019-07-08 12:25 이야기 > AMD 나비, 하와이의 재림. 그러나... *6
- 2019-07-08 10:41 이야기 > 라이젠 마티스는 지금 사기엔 이르단 생각입니다 *18
- 2019-07-04 18:54 이야기 > SUPER? 그다지 수퍼하지 않은 수퍼지만... *24
Who's 잼아저씨
-
가슴이 대근대근
-
보고싶은데 어떻게 안되나요? ㅋㅋ
-
이따가 대근님을 보기로 했는데 채찍질 해보겠습니다.
-
아뇨 대근님을 보고 싶다구요 ㅋㅋ
얼굴이라도 비춰달라 해줘요 ㅠㅠ
-
손님 여기에서 이러시면 안됩니다!
-
DG님이 빨리 일했으면 좋겠습니다. (2)
-
1080ti는 얼마나 또 어마어마 할런지;;;
-
int8은 말 그대로 8비트 정수를 의미하고 이는 cChar 형 = usign 0x0~FF, sign +-D 0x7F를 뜻하는데
일반적으로 연산을 할 때에는 float 내지는 일반 int형을 사용합니다.
https://arxiv.org/pdf/1605.06402v1.pdf
4.4.2 Quantization to Fixed Point 항목에서 언급하고 있는것 처럼 32비트 부동소수형을 8비트형으로 잘라내면서 수의 정확도가 10.3% 감소하고 튜닝등을 통하여도 그 오차율을 감소시킬 수 있지만 양자화 이전의 값을 온전히 표현할 수 는 없습니다.하지만 int8 등의 작은 데이터형을 사용하면 처리시간을 단축시킬 수 있으며, 변수가 많은 기계학습 환경과 지능에는 정답이 없기에 정확도 보다는 연산 속도의 이득을 보기 위한 결정 같습니다.
이는 게임 그래픽에서 폴리곤 처리에 float 형 자체를 사용하지 않고 half-float; 반정밀도 부동소수점을 사용하거나, 포맷 처리에 32bit RGBA를 그대로 사용하지 않고 2bit quantized-16bit 5:6:5형을 사용하는것과 비슷한 이유로 보입니다.
-
하얀건 바탕이고 검은건 글씨인가...
-
제가 이해할 수 있는 부분은 딥러닝은 정확도보단 빠른 처리가 중요하다는 것인데, 이해할 수 없는 부분은 왜 부동소수점이 아니라 정수를 쓰느냐입니다. 반정밀도와 INT8의 관계에 대해 말씀해주시면 좋겠습니다.
이건 마치 총론도 못 배운 사람에게 각론을 가르치는 일이니 한국어로 말씀해주시면 감사하겠습니다. ㅠㅠ 쌀로 밥 짓는 소리 같이 보이시겠지만 저는 쌀이 뭔지도 몰라요. -
일단 정수형 자체가 부동소수점 실수보다는 빠릅니다.
또한 정수형 또한 고정소수점으로 실수를 표현할 수 있습니다.
3.141592를 표현하기 위해 정수로 3,141,592 라는 수를 표현하기 위해 여러가지 방법이 있지만 한가지 방법으로 3141592/1000000 꼴의 방법으로 처리할 수 있습니다.
이 방법은 대신 표현할 수 있는 정확도의 손실 등 단점이 있지만 어쨌든 컴퓨터가 보기에는 저장된 수 자체는 그냥 정수나 다름 없기에 빠른 처리가 가능합니다. 컴퓨터 그래픽에서 예로 든 half-float의 경우 4바이트만을 사용해서 lim(n->-inf) - 0 - lim(n->inf) 꼴의 실수를 표현하는 방법이고 이보다 더 작은 크기로 1바이트, int8 과 같은 자료 크기를 가지고 있는 minifloat 또한 실수를 표현하는데 사용할 수 있습니다.다만 float 은 표현할 수 있는 수 자체에 한계가 있는데다, 부동소수점을 표현하는데 있어 비트 크기가 줄어들수록 수의 정확도가 감소하게 됩니다.
By brf - Own work, Public Domain, https://commons.wikimedia.org/w/index.php?curid=821291
첨부된 위에서 링크된 문서의 정수를 사용한 고정소수점 에서 상황에 따라 int8과 같은 크기인 minifloat을 사용한 자료형의 정확도 비교에서 더 낮은 비트 크기를 가지고도 동적형 고정 소수점 표기가 더 높은 정확도를 보여줌으로써, 속도와 신뢰도 둘을 잡을 수 있기에 float 대신 int형 수 표현을 선택한 것으로 보입니다.
설명하는데 별 재주가 없는데 도움이 되셨으면 좋겠습니다.
-
어느정도 이해는 갔습니다. 돌 한테 설명하는 느낌일텐데 진심으로 감사드립니다. ㅎㅎ
-
p100 bus width가 4096이었다니 ㅎㄷㄷㄷ
-
HBM도 미지의 세계입니다. 왜 버스폭이 넓고 클럭이 낮은 방향을 선택했는가도 궁금하네요.
막줄이 핵심이네요 ㅋㅋ