9.1 칩 제조사에서 풀스택(Full-Stack) 컴퓨팅 기업으로의 전환
반도체 역사에서 수많은 전설적인 하드웨어 회사들은 거의 예외 없이 똑같은 비참한 결말을 맞이했다. 처음엔 압도적인 속도의 칩을 만들어 내어 세상을 지배하지만, 이내 경쟁자들이 비슷한 칩을 더 싸게 찍어내기 시작하면 가격 인하의 진흙탕 싸움(Commoditization)에 휘말려 회사의 영업이익률이 휴지 조각처럼 쪼그라들고 만다. 과거 메모리 반도체 회사들이 겪었던 지독한 이 치킨게임(Chicken Game)의 역사적 악몽을 젠슨 황(Jensen Huang)은 서늘하게 직시하고 있었다.
이 9.1장에서는 “우리 엔비디아(NVIDIA)가 언제까지고 단순히 모래판에서 실리콘 칩을 깎는 노가다 제조사로만 남을 순 없다“며 젠슨 황이 내린 거대한 철학적 단절 선언을 짚어본다.
그는 왜 최고의 칩을 만드는 것만으로는 생존할 수 없다고 판단했는지, 그리고 이 실존적 공포를 극복하기 위해 엔비디아의 정체성을 칩(Chip), 시스템(System), 네트워크(Network), 그리고 최상단의 ‘소프트웨어(Software)’ 플랫폼까지 모든 계층 구조를 혼자서 통째로 다 해 먹는 이른바 ‘풀스택(Full-Stack) 컴퓨팅 기업’ 으로 어떻게 광폭하게 밀어붙였는지 그 파괴적인 궤적을 쫓아간다.
9.1.1 하드웨어 의존도를 낮추기 위한 젠슨 황의 소프트웨어 비전
수천조 원에 달하는 AI 칩(Chip) 권력을 움켜쥔 젠슨 황(Jensen Huang)은, 역설적이게도 엔비디아(NVIDIA) 내부 엔지니어들을 향해 하드웨어의 시대는 저물고 있음을 공공연하게 경고했다. “우리가 H100이나 블랙웰(Blackwell) 같은 미친 칩을 만들면, AMD나 인텔, 자체 칩을 깎는 구글(Google) 같은 자본의 괴물들은 1년 2년 안에 필사적으로 우리 칩의 트랜지스터 개수를 베껴내며 턱밑까지 쫓아올 것이다. 물리적인 실리콘은 결코 영구적인 해자(Moat)가 될 수 없다.”
이 뼛속 깊은 위기감 속에서 젠슨 황이 찾아낸 궁극의 신의 방패는 다름 아닌 ’소프트웨어(Software)’였다.
그가 정의한 소프트웨어 비전은 단순히 하드웨어를 돕는 유틸리티 프로그램 수준이 아니었다. 전 세계 개발자들이 오직 엔비디아의 코드 위에서만 숨을 쉬고, 모델을 훈련하며, 애플리케이션을 구동하게 만들어, 만약 그들이 타사의 칩으로 넘어가려 할 때 자신들의 회사 코드를 전부 다 불태우고 파산해야 할 정도의 ‘지독한 전환 마찰력(Friction)’ 을 창조하는 것이었다.
“우리는 이제 칩에 갇힌 노예가 아니라, 세상 모든 기업이 우리 소프트웨어 코드를 가져다 쓰지 않고서는 단 하루도 AI 비즈니스를 영위할 수 없는 생태계 그 자체가 되어야 한다.”
이 비전을 근거로 그는 전체 직원 중 하드웨어 엔지니어보다 소프트웨어 프로그래머의 숫자를 아득히 초과하여 채용하는 미친듯한 인력 구조조정의 마법을 부리며, 가장 거칠고 완벽한 소프트웨어 제국주의의 닻을 올렸다.
9.1.2 칩, 시스템, 소프트웨어를 아우르는 ’통합 플랫폼’의 탄생
젠슨 황(Jensen Huang)의 소프트웨어 야심이 본격화되면서, 엔비디아(NVIDIA)가 세상에 던지는 무기는 단순히 ’연산이 빠른 쇳덩어리’에서 이 세상 그 어느 빅테크 기업도 시도해 본 적 없는 극단적인 수직 계열화 덩어리, 즉 ‘풀스택 통합 플랫폼(Full-Stack Integrated Platform)’ 으로 거대하게 변이했다.
과거에는 인텔(Intel)이 CPU를 파고, 마이크로소프트(MS)가 윈도우(OS)를 파고, 개발자가 애플리케이션을 짜는 각자의 전문 도급 영역이 암묵적인 평화 협력으로 분할되어 있었다. 그러나 엔비디아는 이 룰을 잔혹하게 부숴버렸다.
최하단의 실리콘 GPU를 직접 깎아내고(칩), 그 칩들을 수만 개 묶어 통신시키는 인피니밴드 네트워크와 거대 서버 랙(시스템)을 직접 조립하며, 그 위에 개발자들이 C언어처럼 코드를 치게 만드는 쿠다(CUDA) 병렬 아키텍처를 덮어씌웠다. 여기서 끝이 아니었다. 맨 꼭대기에는 수천만 줄의 특수 미분 회로가 코딩된 산업별 특화 딥러닝 라이브러리(소프트웨어)까지 얹어서, 기업 고객의 책상 위에 오직 엔비디아의 입김만 들어간 통일된 거대 블랙박스를 ’턴키(Turn-key)’로 강제로 식탁에 밀어붙인 것이다.
graph TD
A["엔비디아의 무자비한 풀스택(Full-Stack) 제국"]
A --> B[1: Application & Framework]
B --> |NVIDIA AI Enterprise, NeMo, Clara| B1(초고부가가치 소프트웨어 마진)
A --> C[2: Platform Software]
C --> |CUDA, cuDNN 라이브러리 영토| C1(전 세계 개발자 생태계 완벽 락인)
A --> D[3: System & Network]
D --> |DGX Systems, NVLink, InfiniBand| D1(초거대 하이퍼스케일러 데이터센터 통제)
A --> E[4: Hardware & Chips]
E --> |Hopper, Blackwell GPU 아키텍처| E1(경쟁사가 절대 넘볼 수 없는 물리 연산 속도)
B -.->|이 모든 스택이 0.1초의 지연 없이 완벽히 수직 최적화됨| E
style A fill:#f9f,stroke:#333,stroke-width:2px,color:#fff
경쟁사 AMD가 아무리 좋은 물리 칩을 찍어내도, 그들은 엔비디아처럼 서버 전체 시스템(System)과 그 위에서 미끄러지듯 돌아가는 방대한 AI 소프트웨어(Software)까지 한 세트로 묶어서 팔 능력 자체가 결여되어 있었다. 고객들은 당장 칩 단품의 성능이 아니라, ’박스 포장을 까자마자 당장 우리의 AI 모델 훈련이 광속으로 완벽히 돌아가는가?’를 따졌고, 세상에서 이 통합 플랫폼(Integrated Platform)의 마법을 100% 무결점 상태로 찍어낼 수 있는 기업은 오직 엔비디아 단 하나의 독재 권력뿐이었다.