4.4 병렬 처리 아키텍처의 진화와 철학

4.4 병렬 처리 아키텍처의 진화와 철학

지포스(GeForce) 시리즈의 눈부신 연쇄 폭발적 흥행을 거치며 엔비디아(NVIDIA)는 단순히 덩치를 키우는 데에 만족하지 않았다. 그들은 그 혁신의 핵심 동력인 칩의 근본적인 코어 구조, 즉 아키텍처(Architecture)에 대한 거대하고 철학적인 궤도 수정을 이끌어냈다. 인텔(Intel)을 비롯한 당대의 실리콘 카르텔들이 오직 칩의 분당 회전수, 즉 클럭(Clock) 속도 수치를 극한까지 밀어 올려 모든 컴퓨팅 생태계를 통제하려 드는 이른바 ’권위적인 코어 근육 키우기’에 몰빵하고 있을 때, 엔비디아는 이 오만한 직렬 처리 철학을 전면 부정했다.

4.4장에서는 무겁고 둔탁한 소수의 코어를 끝도 없이 업그레이드할 것인가, 아니면 조금 멍청하지만 기민한 소형 코어 군단을 수천수만 개로 늘려벌릴 것인가를 두고 벌어진 실리콘밸리(Silicon Valley) 내의 웅장한 연산 철학 충돌, ‘직렬 vs 병렬(Serial vs Parallel)’ 의 아키텍처 진화기를 다룬다.

더 나아가 무어의 법칙(Moore’s Law)이라는 인텔이 세운 신성하고 안일한 종교적 타임라인을 통째로 부정하고, 스스로 제품의 집적도와 연산 속도를 무자비할 정도로 기하급수적 진화(Exponential Evolution)시켜버린 엔비디아 특유의 기술 가속의 법칙(Huang’s Law)이 어떻게 설계 본부에 자리 잡게 되었는지 그 지독한 속도의 이면, 소위 ’외계인 고문’이라 일컬어지는 병렬 지상주의의 굳건한 철학을 집중 해부한다.

4.4.1 소수의 강한 코어 vs 다수의 효율적인 코어

컴퓨터의 연산 세계에서 CPU와 GPU의 극단적인 아키텍처 차이는, 마치 전쟁에서 단 몇 명의 전지전능하고 강력한 슈퍼 히어로(Super Hero)에게만 지휘를 맡길 것인가, 아니면 지극히 단순한 명령을 수행하지만 군말 없이 맹렬히 돌격하는 수만 명의 소총수 부대(Infantry Army) 군단으로 적을 쓸어버릴 것인가의 웅장한 철학적 충돌과도 같다.

인텔(Intel)로 대표되던 CPU 진영은 끊임없이 코어 자체의 지능(Logic)을 높이고 동작 속도(Clock)를 키워, 하나의 어려운 수학 미분 방정식이 주어졌을 때 단 0.001초라도 빨리 풀어내는 ‘소수의 강한 코어(Few, Powerful Cores)’ 체제, 즉 철저하고 우아한 직렬 처리(Serial Processing)의 극한을 추구했다.

반면, 젠슨 황(Jensen Huang)이 이끄는 무자비한 엔비디아(NVIDIA)는 복잡한 수식 하나를 푸는 능력에는 큰 관심이 없었다. 그들이 맞서야 할 전쟁은 모니터의 수백만 픽셀(Pixel)이라는 넓고 거대한 평야에, 동시다발적으로 빛과 명암이라는 단순한 곱셈 연산 파편을 초당 60번씩 비 오듯 쏟아붓는 것이었다.

이 거대한 픽셀 노가다를 슈퍼 히어로 몇 명이 순서대로 처리하려 하면 필연적으로 치명적인 정체, 즉 병목(Bottleneck)이 일어날 수밖에 없다. 이에 엔비디아는 칩 안에 크고 강력한 지능형 두뇌를 키우는 대신, 매우 멍청하지만 단순 수학 계산을 전담하는 수백, 수천 개의 초소형 산술 논리 연산 장치(ALU, Arithmetic Logic Unit)들을 실리콘 기판 안에 개미떼처럼 욱여넣는 방식을 광적으로 택했다. 이 거대하고 효율적인 ‘다수의 코어(Massive Efficient Cores)’ 군단이 한 번 규칙을 받아 일제히 동작할 때 내뿜는 무지막지한 병렬 처리(Parallel Processing) 의 화력이야말로, 3D 그래픽을 단숨에 현실로 만들어버리는 폭력적이면서도 가장 우아한 새로운 해결책이었다.

4.4.2 무어의 법칙을 뛰어넘는 엔비디아의 성능 향상 속도

실리콘밸리(Silicon Valley)의 절대적인 기술 종교이자 모든 이들이 숨죽여 따르던 암묵적 율법은 전설적인 고든 무어(Gordon Moore)가 세운 ’무어의 법칙(Moore’s Law)’이었다. 마이크로칩에 집적되는 트랜지스터의 수가 대략 18개월에서 24개월 주기로 2배씩 늘어난다는 이 점근선적인 속도 하에, 전 세계 반도체 업체들은 안도하며 그 느긋한 보폭에 맞춰 신제품을 설계해 왔다.

그러나 치열한 생존의 데스밸리(Death Valley)에서 살아 돌아온 엔비디아(NVIDIA)의 시계는 이 고매한 인피니트 게임의 룰을 철저하게 부수고 파괴했다. 그들은 18개월의 여유를 기다리는 대신, 미친 듯한 병렬 아키텍처 복사와 내부 파이프라인(Pipeline) 개량 구조를 접목하여 성능 지표를 매년 1년에 2배, 심지어 특정 그래픽 벤치마크에서는 ’6개월에 2배’씩 향상시켜버리는, 상식적으로는 물리 법칙을 거스르는 듯한 폭력적인 성장 스케줄(Growth Schedule) 엔진을 장착해 버렸다.

graph LR
    A[반도체 업계의 전통적 속도<br>Standard Pace] --> B[무어의 법칙 Moore's Law]
    B --> C[18~24개월 주기마다 트랜지스터/성능 2배 점진 진화]
    C --> D(인텔 등 CPU 제국의 안정적 발전 모델)
    
    E[엔비디아의 이단적 스피드<br>NVIDIA's Deviant Speed] --> F[황의 법칙 Huang's Law]
    F --> G[6~12개월마다 병렬 연산 코어 증식으로 2배 파괴적 진화]
    G --> H(압도적 연산량으로 경쟁 하드웨어 조기 몰락 유도)
    
    style F fill:#f9f,stroke:#333,stroke-width:2px,color:#fff

대중적인 업계 사람들은 이 정신을 나가게 만드는 속도를 일컬어, 일명 ‘황의 법칙(Huang’s Law)’ 내지는 ’엔비디아의 외계인 고문 스케줄’이라 불렀다. 칩 설계 부서 전체를 끊임없이 갈아 넣어 코어(Core)의 수를 무자비하게 배수로 늘려 박는 이 원초적인 렌더링(Rendering) 성능 향상 체급 전은, 여전히 CPU 설계의 미학에 머물러있던 고루한 경쟁자들을 완벽히 질식시켜 무릎 꿇게 한 가장 잔혹하면서도 압도적인 무기였다.