메뉴 건너뛰기

조회 수 963 추천 수 0 댓글 4
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부
Extra Form

GTX 960 리뷰를 공개하며 VGA 계산기가 리뉴얼된 경위를 간단히 소개한 바 있다. (아래 링크 참조) 이 글에서는 외전격으로 거기 얽힌 비하인드 스토리 하나를 적어 보려 한다.

 

- 맥스웰의 모든 것 1 : 이론편 : http://iyd.kr/708

 

VGA 계산기를 리뉴얼하며 가장 골치아팠던 부분이 각 요소간의 밸런스를 찾는 일이었다. 막판에 가서는 TMU와 ROP, 메모리 대역폭의 상대적인 비중을 어떻게 할 것인가- 로 압축되었는데, 이때 가장 신경쓴 것이 아래 네 쌍의 성능관계 시뮬레이션이었다. 이들은 각기 엇비슷한 성능을 갖는 가운데 미세한 차이로 앞서거나 뒤서거나 한다.

 

1. GTX 570과 GTX 650 Ti Boost (>)
2. GTX 580과 GTX 660 (>)
3. GTX 650 Ti와 GTX 750 (<)
4. GTX 780 Ti와 GTX 970 (>)

 

헌데 아무리 조절해도 이 넷을 동시에 만족시키기 어려웠다. 특히 3번과 4번의 경우가 그러했는데, 그도 그럴 것이 이 둘은 모두 전형적인 '케플러 대 맥스웰' 비교로 케플러와 맥스웰의 특성이 양쪽 모두에 적용되어야 하나 그로부터 이끌어내야 하는 결론은 3번은 GTX 650 Ti < GTX 750, 4번은 반대로 GTX 780 Ti > GTX 970이었기 때문. 같은 논리를 사용해 반대의 결론을 이끌어내야 하는 모순 때문에 꽤 오랜 시간 (전체 작업시간에 대한 비율로 생각했을 떄 거의 절반 이상을!) 머리를 싸매고 있어야 했다.

 

여기서 잠깐 설명. 케플러는 1SM당 ALU 갯수가 맥스웰의 1.5배, TMU 갯수는 2배로 전반적으로 풍부한 자원을 갖췄다. 맥스웰은 그에 비해 상대적으로 많은 ROP 갯수를 갖고 있기에 VGA 계산식에서 TMU의 비중이 커지면 케플러에 유리해지고 ROP의 비중을 늘리면 맥스웰에 유리해진다. (이것이 전부는 아니지만 요약하자면 그렇다.)

 

244FFB3E54C4FDBD0DFCC8

 

2653B03E54C4FDBD0635B0

 

위의 그림은 각각 TMU의 비중이 높을 때와 ROP의 비중이 높을 때의 예시. 이런 과정을 거치며 각 요소별 계수를 확정하던 중 아래와 같이 의문점이 정리되기 시작했다.

 

1. GTX 750의 ROP / 메모리 단위성능이 유독 좋거나
2. GTX 970의 ROP / 메모리 단위성능이 유독 나쁘거나

 

상식적으로 맥스웰 1세대로서 등장한 GTX 750보다 2세대 제품들이 어떤 방면에서든 더 나빠졌으리란 기대를 할 수 없었기에, 1번 가설을 기각하고 보면 2번이 남는다. 지금에야 편의상 GTX 970이라 이름붙였으나 당시의 생각으로는 '맥스웰의 메모리 효율이 나빠졌나...?' 쯤 되었다. 그런데 맥스웰의 가장 큰 변화 중 하나가 바로 델타 컬러 압축으로 메모리 대역폭의 실효성을 높인 것이라 이것 역시 말이 안된다. 그렇다면 결국 맥스웰 전반으로 일반화할 수 없는, GTX 970만의 특별한 -악영향을 미치는- 무언가가 있다는, 다소 당황스런 결론에 도달한다.

 

"GTX 970의 ROP / 메모리 파트에 결함이 있다."

 

관점에 따라 너무 공격적일 수 있어 당시로선 차마 공론화하지 못했다. (아닌 말로 엔비디아가 소송을 걸면 어쩌나 하는 염려도 있었다.) 그 후, GTX 960 샘플을 입수하게 되어 VGA 계산기는 잠시 미뤄둔 채 벤치마크에 파묻히게 되었고, 한동안 잊고 지내다 오늘 오랜만에 뉴스들을 눈팅해 보니 이런 일이 있던 것이다.

 

http://www.extremetech.com/extreme/198214-198214

http://techreport.com/news/27721/nvidia-admits-explains-geforce-gtx-970-memory-allocation-issue

http://www.pcper.com/news/Graphics-Cards/NVIDIA-Responds-GTX-970-35GB-Memory-Issue

 

간단히 요약하자면 총 256bit / 4GB로 구성된 GTX 970의 메모리 중 실효성 있게 쓰이는 영역이 224bit / 3.5GB에 불과하다는 것. (기사에는 언급되지 않았으나 맥스웰의 경우 ROP와 메모리 컨트롤러가 같은 파티션으로 묶여 있기에, 유효 ROP 역시 64개가 아니라 56개일 것으로 추측된다.) 이로써 정확히 VGA 계산기가 난항을 겪어 오던 부분이 제거된 것이다. 이를 토대로 GTX 970의 메모리 비트레이트에 256 대신 224를 대입하면 안정적으로 GTX 780 Ti에 대한 근소 열세라는 성능관계가 수립된다.

 

234EA03E54C4FDBD0F689A

 

놀랍지 않은가.

아래는 가장 최근까지 확정된 식에 GTX 970을 각 시나리오별로 대입한 것.

 

1. 메모리 / ROP 모두 스펙 그대로인 경우 (256bit / 64개)

 

2447FF3E54C4FDBE1899E6

 

2. 메모리는 224bit로 줄어들되 ROP는 스펙 그대로인 경우

 

2149143E54C4FDBE17CB94

 

3. 메모리 / ROP 모두 224bit / 56개로 줄어든 경우

 

2441A53E54C4FDBE1F7CA7

 

GTX 780 Ti와의 성능관계를 생각할 때 1번이 아님은 이미 확실해졌고, 그렇다면 2번과 3번 중 어느 것이 진실일까. 보다 다양한 벤치마크 통계를 메타데이터처럼 모아 분석하면 의외로 간단히 추론될지도 모르겠다. 훗날 엔비디아가 GTX 970의 ROP에 관해서도 결함이 있음을 인정한다면 그때 이 글이 한번쯤 회자되기를 바란다.


Who's DGLee

profile

페북/drmolaByIYD

트위터/iyd_twit

팔로우 및 친추 환영합니다! :D

▼ 펼쳐 보기
Atachment
첨부 '1'
  • profile
    heorm 2015.01.26 19:10
    와 여러 시나리오(?)에 대한 정보 잘 보았습니다.
  • ?
    nameGT 2015.01.27 16:15
    970이 시끌시끌 하구만....
  • profile
    마징가루 2015.01.29 10:21
    이해는 잘 안가지만 좋은정보같네요
    잘 보고갑니다
  • profile
    섭섭Oi 2015.01.29 10:30
    좋은 글 같은데.....ㅡ.ㅡ
    그래도 찜찜함이 ㅎㅎㅎ

  1. AMD의 또다른 수 : 버뮤다, 피지 - 두개의 빅 칩?

    AMD가 ATI를 인수한 2006년. AMD의 인수 일성은 "스윗 스팟을 공략하겠다" 는 것으로 요약된다. 인수 직전까지 ATI가 출시했던 최상위 제품인 라데온 HD 2900 XT는 R200 GPU를 탑재하고 있었는데 이 칩의 면적은 420mm2(제곱밀리미터)에 달했다. 이 기록은 제...
    Date2015.01.29 ByDGLee Views685
    Read More
  2. 엔비디아와 AMD의 다음 수 : GM200? Fiji XT?

    1. 앞서 링크의 글 (http://iyd.kr/688) 에서 엔비디아와 AMD의 차세대 GPU의 성능을 예상해본 바 있다. 해당 글이 작성된 이후로 상당한 시간이 경과했고, 그 사이 양사의 차세대 제품에 관해 유통되는 정보에도 적잖은 변화가 있었으며 무엇보다 예상의 근거...
    Date2015.01.29 ByDGLee Views815
    Read More
  3. METAL GEAR SOLID V : GROUND ZEROES

    ■ METAL GEAR SOLID 메탈기어 시리즈는 코나미 산하 코지마 프로덕션에서 제작된 전통이 깊은 잠입액션 게임으로 두터운 팬층을 보유 하고 있으며 주요 제작자로는 천재라고 불리우는 코지마 히데오가 있다. 메탈기어 시리즈의 아버지의 코지마 히데오는 코나...
    Date2015.01.29 ByZardLuck Views1777
    Read More
  4. Phanteks Enthoo EVOLV Black 대양케이스 2부 - 스펙 및 조립 가이드

    PHANTEKS ENTHOO EVOLV 1부 외형편에 이어 준비한 두 번째 컬럼으로 전체적인 스펙을 살펴보고 케이스(PHANTEKS ENTHOO EVOLV)에 대한 이해도와 조립 편의성 및 확장성 등을 간접적으로 확인하고 느껴볼 수 있는 시간을 가져보자. 'PHANTEKS ENTHOO EVOLV...
    Date2015.01.28 ByReignX Views2663
    Read More
  5. 제조사의 역할, 유저의 역할, 커뮤니티의 역할

    최근 엔비디아의 '지포스 GTX 970' 제품과 관련해, 이 제품이 탑재한 4GB 메모리가 실제 사용환경에서 다 사용되지 못하고 3.5GB 부근까지만 사용된다는 제보로 처음 문제제기가 되었던 바 있습니다. 단순한 해프닝쯤으로 여겨지던 사건이 다수 유저의 동일증...
    Date2015.01.27 ByDGLee Views836
    Read More
  6. ZOTAC FireStorm - 그래픽카드 오버클럭 가이드

    이번 가이드에서는 조텍 그래픽카드의 오버클럭킹 유틸리티 "ZOTAC FireStorm" 입니다. 파이어스톰?? 3DMARK 이름과 동일하지만, ZOTAC FireStorm은 GPU / 메모리 클럭속도, 전압 및 팬 속도를 미세하게 조절할 수 있으로 소비전력 모니터링 기능, 프로파일 ...
    Date2015.01.27 BynameGT Views18314
    Read More
  7. 맥스웰의 모든 것 2 : GTX 900 시리즈 벤치마크

    이 글에서는 이전 글에서 간략히 설명한 맥스웰 아키텍처의 현실에서의 성능을 검증해 보도록 하겠습니다. 때마침 오늘 출시된 GTX 960을 소개하는 겸, 간단히 생긴 모습을 보고 가도록 하겠습니다.   테스트 자체는 모종의 경로로 입수한 샘플로 진행했으며 (...
    Date2015.01.25 ByDGLee Views1024
    Read More
  8. 맥스웰의 모든 것 1 : 이론편

      그래픽카드 리뷰 카테고리엔 정말 오랜만에 새 글을 올리게 되었습니다. 아마 작년 1세대 맥스웰 -GM107 : GTX 750 시리즈- 리뷰가 마지막이었죠? 그 동안 2세대 맥스웰 -GM204 : GTX 970/980- 이 출시되었지만 타이밍을 놓쳐 엠바고에 맞춰 리뷰를 올리지...
    Date2015.01.25 ByDGLee Views615
    Read More
  9. VGA 성능 방정식 비하인드 스토리 : 뜻밖의 천기누설

    GTX 960 리뷰를 공개하며 VGA 계산기가 리뉴얼된 경위를 간단히 소개한 바 있다. (아래 링크 참조) 이 글에서는 외전격으로 거기 얽힌 비하인드 스토리 하나를 적어 보려 한다. - 맥스웰의 모든 것 1 : 이론편 : http://iyd.kr/708 VGA 계산기를 리뉴얼하며 가...
    Date2015.01.25 ByDGLee Views963
    Read More
  10. ASUS GPU Tweak - 그래픽카드 오버클럭 가이드

    3D 게임 및 벤치마킹에서 더 높은 프레임 속도를 원하는 사용자들은 기존에 사용하는 그래픽카드보다 더 좋은 그래픽카드를 구매하거나 오버클럭킹을 통해 성능을 높일 수 있습니다. 이번 그래픽카드 가이드에서는 ASUS의 그래픽카드 오버클럭킹 툴인 "GPU Tw...
    Date2015.01.22 BynameGT Views12610
    Read More
  11. NVIDIA GeForc ASUS GTX 960 STRIX DC2 OC D5 2GB

    게임을 즐기는데 있어 PC를 구성하는 많은 부품들 중 그래픽카드는 단연 매우 큰 비중을 차지하고 있다고 말할 수 있습니다. 따라서, 게임 만큼은 오히려 CPU의 성능 보다는 그래픽카드 성능에 따라 더 큰 영향을 받는 절대적인 한 부분이라 하겠습니다. 앞서...
    Date2015.01.22 ByZardLuck Views1727
    Read More
  12. 검은사막(Black Desert) - 2부 시스템, 그래픽

    ■ 강력한 커스터마이징 게임을 시작하기에 앞서 가장많은 시간을 투자하는 강력한 커스터마이징은 눈,코,입의 근육부터 색상까지 세세한 조정이 가능한데, 닮은 연예인과 캐릭터 만들기등 많은 이슈가 있었습니다. 단, 느린 반응속도와 X,Y,Z 3축 기반으로 일...
    Date2015.01.12 ByZardLuck Views1505
    Read More
Board Pagination Prev 1 ... 40 41 42 43 44 45 46 47 48 49 Next
/ 49
CLOSE

SEARCH

CLOSE