AMD는 미 동부시 기준 오전 9시를 기해 HPC 시장을 겨냥한 그들의 최상급 전문가용 그래픽카드 겸 연산 가속기를 출시했다. 이젠 정말 28nm 공정의 끝자락을 잡았다고 봐도 좋겠다. 피지 GPU 두 개를 탑재한 파이어프로 S9300 X2가 오늘의 주인공이다. 놀랍게도 배정밀도 연산성능은 여전히 단정밀도의 16분의 1에 머물러 있다. 이쯤 되고 보니 우리 모두 중대한 착각에 빠져 있었단 생각이 든다. 실은 처음부터 피지에게 있어 '고성능 배정밀도 연산유닛' 같은 건 없던 게 아니었을까. 불행히도 오늘의 발표를 통해 이러한 추측은 상당히 맞아떨어지는 부분이 있다.

 

잠시 숲을 바라보자. HPC는 주지하다시피 고성능 연산 컴퓨팅(High Performance Computing)의 약자로 전통적 의미에서의 슈퍼컴퓨팅과 일맥상통하는 분야를 가리킨다. 오늘날 이 기술이 적용되는 분야는 대단히 넓어져서 의료, 금융뿐 아니라 천문학, 기계학습(머신러닝), 감식(포렌식), 수학적 모델링과 생명과학 분야에까지 응용되고 있는 실정이다. 예컨대 제약업계에서는 인간의 머리로 계산해내기 힘든 단백질의 형성구조를 파악하기 위해 최첨단 GPU의 도움을 받고 있기도 하다. GPU가 HPC에 곧잘 응용되는 것은 CPU보다 연산 효율이 좋기 때문이다. 여기서 효율이란 말 그대로 '모든 측면에서의' 효율을 가리킨다. 이미 CPU는 GPU의 전성비, 면적대 성능비, 가격대 성능비 등 어떤 것도 따라올 수 없게 되었다.

 

 

 

전통적으로 HPC 시장에서의 '연산'이란 일반 데스크탑 용도에서의 그것과는 퍽 달랐다. 우선 데이터의 규격부터가 32bit 단정밀도(single precision)가 아닌 64bit 배정밀도(double precision)를 사용하는 경우가 많았다. 한 번의 연산을 수행하더라도 높은 정밀도로 행해야 하는 과학기술의 특성이 고스란히 반영된 것이다. 이러한 추세는 기계학습이 대세로 떠오르며 서서히 무너졌는데, 여기서는 '단 한 번의 정밀한 연산' 보다는 다소 부정확할지라도 압도적으로 많은 연산을 수행해 경험을 누적하는 편이 더 나은 '학습'을 낳기 때문이다. 자연히 연산 횟수를 늘릴 수 있다면 정밀도를 희생해도 괜찮다는, 심지어 단정밀도보다도 덜 정밀한 수준이라도 좋다는 사상은 16bit 반정밀도(half precision)의 중요성을 높이는 결과를 낳았다. 이와 맞물려, 오늘날 HPC 용도에 있어 배정밀도의 중요성은 꾸준히 감쇄되어 오고 있다.

 

 

이러한 연장선에서 AMD가 배정밀도를 그리 부각하지 않은 파이어프로를 발표했다는 사실 자체가 대단한 파격은 아니다. 굳이 이 제품이 특별할 이유를 찾자면, -슬라이드에 나타난 대로 "가장 빠른 단정밀도 연산장치"여서가 아닌 다른 이유를- 누구든 '전통적 연산 프로세서' 로서의 모든 덕목을 갖췄으리라 믿어 의심치 않았던 피지 GPU가 실은 그렇지 않았다는 점이 첫번째일 것이고, 그간 제미니라는 코드네임으로 불리던 듀얼 피지 기판의 정체가 바로 이것이리라는 점이 두번째다. 기억하겠지만 2주 전 출시된 라데온 프로 듀오의 기판은, 모두가 그것의 원형이라 믿어 의심치 않던 제미니와 전혀 닮지 않았었다. 결국 AMD는 또 한번의 반전을 예비해두고 있던 셈이다.

 

 

오늘의 주인공, 파이어프로 S9300 X2은 수치로만 보아 라데온 프로 듀오보다 단 하나도 나은 것이 없다. 1GHz의 작동 속도를 바탕으로 16 테라플롭스의 연산성능을 자랑하던 라데온 프로 듀오를 보면서도 한편으로는 '쟤는 배정밀도 성능이 떨어지니까', 높은 배정밀도 성능과 ECC 등 '전문가용 그래픽카드다운' 무언가로 잔뜩 무장한 새로운 파이어프로를 기대하는 마음이 한켠에 수그러들지 않고 있던 필자였다. 그러나 그러한 바램은 최소한 파이어프로 S9300 X2이 이뤄줄 수는 없게 되었다. 나아가 피지 자체가 그러한 용도로 디자인된 GPU가 아니라는 정황이 속속 드러나고 있다.

 

 

사양표를 살펴보자. 하와이에 기반한 나머지 세 파이어프로들이 수 테라플롭스급의 배정밀도 연산성능을 갖춘 것과 달리 S9300 X2는 0.8 테라플롭스에 불과한 배정밀도 연산성능을 갖는다. 게다가 굳이 언급하지 않았으면 모르고 넘어갔을 수 있었지만 친절하게도 S9300 X2가 ECC 메모리를 "지원하지 않는다"고 표기까지 해 두었다. 단순히 쿨하다거나 그렇지 않은 차원의 문제가 아니라, AMD가 이를 통해 알리고자 하는 바가 있단 얘기다. 그것은 바로 아래의 슬라이드를 통해 구체화된다.

 

 

만약 높은 배정밀도 연산성능을 원한다면, 당신이 사야 할 것은 S9300 X2가 아니라 S9170이라는 것. 과하게 친절하지 않은가. 놀랍게도 우리는 이와 비슷한 전략을 이미 일년 전 한번 보았다. 지포스 GTX 타이탄 X를 발표하며 엔비디아는 이를 최강의 단정밀도 연산성능을 갖춘 GPU로 홍보하는 한편 배정밀도 성능을 원하는 이들은 기존의 타이탄 Z를 구매하면 된다고 했었다. 맥스웰은 애초 높은 연산성능을 위해 개발된 GPU가 아니었던 탓에 배정밀도 연산유닛 자체가 상당 부분 제거되어 있었기 때문이었다. 이를 AMD의 현 상황에 대입하면, 피지야말로 게임 성능에 올인해 배정밀도 연산유닛을 상당히 제거하고 나온 것이었다는 당황스런 결론에 도달한다. 하와이보다 크게 개선되었던 전성비의 신비가 벗겨지는 순간이다.

 

 

어쨌든 S9300 X2는 -비록 라데온 프로 듀오보다는 못할지언정- 똑같은 HPC 시장 타겟의 테슬라들과 비교해 가장 높은 단정밀도 연산성능을 제공한다. 똑같은 300W TDP 내에서 2~2.5배의 연산성능을 얻어낼 수 있다는 점은 보통 매력적인 게 아니다. 메모리 대역폭 역시 1TB/s로 비교 대상인 테슬라들보다 2~3배 더 높다. 다만 HBM의 경직된 용량 구성상 전문가용 그래픽카드임에도 고작 8GB '밖에' 안 되는 VRAM을 탑재했다는 점은 상황에 따라 큰 약점이 될 수 있다. 적어도 메모리에 대한 한 뚜렷한 장점과 단점이 항상 공존하는 셈이다.

 

말 나온 김에 이것도 짚고 넘어가자. 파이어프로 S9300 X2의 TDP는 언급했다시피 300W이다. 2주 전 출시되었던 라데온 프로 듀오는 375W의 TDP를 가졌었는데 8핀 보조전원 3개를 달고 있었다. 간단히 생각해 300W TDP를 깔끔하게 맞출 수 있다면 8+6핀 구성이나 8+8핀 구성으로 충분할 것이다. 여기서 실종된 '제미니'의 단서가 읽힌다. 아래 사진을 보자.

 

 

 

오른쪽이 바로 문제의 '제미니' 기판 사진이다. AMD가 단지 '보여주기' 위한 용도로 엄청난 시간을 투자해 전혀 쓰이지 않을 기판을 하나 만들어냈다고 믿는 것보다는 어떤 식으로든 다른 곳에 쓰였다고 보는 편이 더 합리적이다. AMD처럼 형편이 넉넉하지 못한 회사의 경우라면 더욱 그럴 것이다.

 

신공정의 도입이 지연되며 AMD, 엔비디아 양사가 맞닥뜨리게 된 상황은 양사 모두에게 있어 그들이 처음 28nm 공정을 도입할 때만 하더라도 전혀 예상하지 못한 상황이었을 것이다. 외부 여건은 그들로 하여금 나란히 600 제곱밀리미터 면적의 초 거대한 칩을 만들 수밖에 없게 했고, 양사의 설계 팀은 필연적으로 무언가를 포기하거나 다른 무엇과 타협해야만 하는 상황에 놓이게 되었다. GM200이나 피지가 배정밀도 연산성능을 결여하고 있으며 제한된 메모리 지원에 머무른 것은 이와 무관치 않다.

 

어쩌면 '선택과 집중'을 강요받는 잔인한 현실 속에서 AMD가 취할 수 있던 최선의 절충이 바로 스트림프로세서를 대폭 늘리는 것이었을지 모른다. 양 극단에는 전통적 의미에서의 '빅 뷰티'를 만들어내는 것과 연산성능을 포기하고 ROP에 올인한, 전통적 의미에서의 '게임용 GPU'를 만드는 것쯤이 있었을 게다. 어쨌든 그 결과 AMD는 '최고의 단정밀도 연산성능'이라는 하나의 패를 손에 더 쥐게 되었다. 라데온 프로 듀오와 파이어프로 S9300 X2의 등장은 그런 면에서 의미가 있다. 그러나 순수한 게임용 그래픽카드도, 순수한 연산용 그래픽카드도 아닌 이들의 좁디좁은 틈새시장에도 과연 빛이 들까. 이들의 성공이, 양사의 차기 GPU가 얼마나 늦게 도달하느냐에 달렸단 점이야말로 지독한 아이러니다.

글쓴이 님의 최신글
  1. 2016-08-11 01:51 IT 소식 > 잘 키운 시게이트 하나 삼성 넷보다 낫다? : 사상 초유의 60TB SSD 소개 *7
  2. 2016-08-04 22:29 이야기 > 라데온 RX 470 엠바고가 풀렸습니다 + 향후 리뷰 계획 *5
  3. 2016-08-02 11:56 IT 소식 > 닌텐도 차기 콘솔 엔비디아 SoC 탑재설 : 테그라의 부활?
  4. 2016-08-02 03:00 이야기 > 냉동참치를 소개합니다 *11
  5. 2016-07-27 15:21 IT 소식 > AMD, 폴라리스 기반 전문가용 그래픽카드 발표 *1

Who's DGLee

profile

페북/drmolaByIYD

트위터/iyd_twit

팔로우 및 친추 환영합니다! :D

▼ 펼쳐 보기
Prev MSI, MSI 웨이코스 고객감사 이벤트 MSI, MSI 웨이코스 고객감사 이벤트 2016.04.01by ITCM ADATA, USB 메모리 봄맞이 이벤트 Next ADATA, USB 메모리 봄맞이 이벤트 2016.03.31by ITCM

Articles

12 13 14 15 16 17 18 19 20 21
-->