9.4 독점적 플랫폼 생태계의 비즈니스적 가치

9.4 독점적 플랫폼 생태계의 비즈니스적 가치

소프트웨어와 클라우드 인프라까지 무자비하게 빨아들인 엔비디아(NVIDIA)의 제국. 경쟁사나 월스트리트(Wall Street)의 공매도 세력들은 주기적으로 “결국 더 빠르고 값싼 새로운 반도체가 등장하면, 이 거품 같은 독점 체제도 한순간에 무너질 것이다“라며 애써 위안을 삼곤 했다. 그러나 그들은 ’반도체 단품 전투’가 아닌 ’생태계 플랫폼(Platform Ecosystem) 전쟁’이라는 전혀 다른 차원의 물리법칙을 제대로 관통하지 못하고 있었다.

9.4장에서는 엔비디아가 하드웨어를 버리고 영혼을 이식시킨 소프트웨어 생태계가 도대체 어떻게 ‘무너질 수 없는 락인(Lock-in)’ 이라는 서늘한 비즈니스 족쇄로 진화했는지를 파헤친다.
수백만 명의 천재 개발자들이 어떻게 자신들의 발에 쿠다(CUDA)라는 족쇄를 자발적으로 채우고 방어군을 자처하게 되었는지, 그리고 AMD 같은 절박한 후발주자들이 ’ROCm’이라는 오픈소스 칼날을 들고 발악을 하며 달려들었음에도 불구하고 왜 결국 젠슨 황(Jensen Huang)의 거미줄 같은 파리 지옥을 절대 빠져나갈 수 없었는지, 그 지독하고 완고한 종속 시스템의 본질적 가치를 생생하게 까발려본다.

9.4.1 CUDA 기반 개발자 커뮤니티의 강력한 락인(Lock-in) 효과와 전환 비용

애플(Apple)의 폐쇄적인 iOS 생태계를 빠져나가 안드로이드 폰으로 갈아타려 할 때 소비자는 앱 구매 내역과 익숙함을 잃는 약간의 짜증을 견뎌야 한다. 하지만 엔비디아(NVIDIA)의 쿠다(CUDA) 생태계에서 타사의 컴퓨팅 툴로 빠져나간다는 것은 약간의 짜증 수준이 아니었다. 기업 입장에선 그것은 곧 ‘완벽한 자살(Total Suicide)’ 이었다.

전 세계 400만 명이 넘는 핵심 딥러닝(Deep Learning) 개발자와 연구원들이 15년 가까이 대학 시절부터 써오며 작성하고 쌓아 올린 수십억 줄의 오픈소스 코드, 논문, 오류 해결 방법들은 100% 모조리 CUDA의 언어와 규칙에 완벽히 종속되어 기록되어 있었다.
만약 어떤 회사가 “단가가 싸니까 내일부터 AMD의 칩을 쓰자!“고 경영진이 선언한다면, 그 회사의 소프트웨어 엔지니어들은 기존에 작성하여 원활히 돌아가던 수천만 줄짜리 회사의 핵심 인공지능 알고리즘을 전부 새 언어로 처음부터 다시 짜야만 했다. 그 포팅(Porting) 과정에 들어가는 수백억 원의 추가 인건비와, 코드가 변경되며 발생하는 치명적인 예측 불가 연산 오류들, 그리고 무엇보다 그것들을 수행하느라 뒤처지는 ’경쟁에서의 시간적 상실’이라는 거대한 공포!
이 어마어마한 ‘전환 비용(Switching Cost)’ 은 어떤 후발 칩 제조사가 “우리 칩이 전성비가 30% 더 좋습니다 무조건 싸게 드릴게요“라고 유혹하더라도 기업들이 눈물겨운 발작을 일으키며 타사 칩 구매를 포기하게 만드는 가장 무시무시하고 절대적인 콘크리트 장벽(Moat)으로 기능했다.

9.4.2 하드웨어 판매를 견인하는 소프트웨어 킬러 애플리케이션의 선순환 구조

엔비디아(NVIDIA)가 쌓아놓은 플랫폼 비즈니스의 가장 지독한 미학은, 소프트웨어와 하드웨어 사이에서 미친 듯이 소용돌이치며 꼬리를 물고 스스로 팽창하는 기괴한 선순환(Virtuous Cycle) 생태계 구조에 있었다.

젠슨 황(Jensen Huang) 휘하의 엔지니어들은 단지 범용 도구를 까는 데 그치지 않고, 그 당시의 기술자들이 가장 목말라하는 미친 최적화 파츠를 계속해서 세상에 던져놓았다. 예를 들어 트랜스포머(Transformer) 언어 모델 훈련 속도를 수 배 끌어올리는 특수 라이브러리인 ‘텐서RT-LLM(TensorRT-LLM)’ 같은, 그 누구도 따라 짜기 힘든 극강의 소수점 최적화 블록을 무료로, 오직 자사 최신 칩(H100) 전용으로 업데이트해 주었다.

graph TD
    A[NVIDIA의 플라이휠Flywheel 전략]
    
    A --> B[최신 고성능 하드웨어 GPU 출시]
    B --> C[개발자 커뮤니티용 초고속 특화 소프트웨어/라이브러리 배포<br>TensorRT 등]
    
    C --> D[전 세계 개발자들이 해당 SW를 기반으로<br>최신 AI 킬러 애플리케이션 생성]
    D --> E[그 킬러 앱의 구동을 위해 기업들은<br>다시 엔비디아의 최신 하드웨어를 폭발적으로 강제 구매]
    
    E -.-> B
    
    style A fill:#f9f,stroke:#333,stroke-width:2px,color:#fff
    style E fill:#f55,stroke:#333,stroke-width:2px,color:#fff

대기업 입장에서는 자신들이 수백만 달러를 아껴가며 소프트웨어 엔지니어를 갈아 넣어 코드를 최적화하느니, 차라리 엔비디아가 이리 완벽하게 깎아놓은 소프트웨어(킬러 애플리케이션)를 그대로 가져다 돌리는 것이 훨씬 저렴하고 폭발적이었다. 단 전제 조건은 하나, 그 소프트웨어는 무조건 오직 엔비디아의 ‘가장 최신형의 비싼 은색 하드웨어 칩’ 위에서만 오류 없이 기적적인 퍼포먼스를 내도록 교묘하게 세팅되어 있었다는 점이다. 무자비할 정도로 훌륭한 소프트웨어가, 수만 달러짜리 고철 하드웨어를 미친 듯이 강매시키는 가장 살인적이고 강력한 마케팅 직원이 되어버린, 절절 끓는 독점의 자기 증식 구조였다.

9.4.3 경쟁자들의 오픈소스 진영(ROCm 등) 반격과 엔비디아의 방어 전략

자신들의 모가지가 완전히 젠슨 황(Jensen Huang)의 쿠다(CUDA) 사슬망에 묶여있음을 깨달은 글로벌 빅테크 기업들과 AMD 같은 후발 주자들은 극도의 공포에 질려, 이 독재를 타파하기 위한 거대한 연합군을 결성했다. 그들의 핵심 전략은 바로 엔비디아(NVIDIA)의 폐쇄적인 독재를 깨부술 수 있는 ‘오픈소스(Open Source)’ 진영의 구축이었다.

AMD는 쿠다를 대체하겠다며 ’ROCm’이라는 개방형 소프트웨어 플랫폼을 무료로 살포했고, 인텔(Intel)은 ’oneAPI’를 들고나왔다. 심지어 메타(Meta), 구글(Google) 같은 거대 소프트웨어 공룡들조차 “우리 코드를 어떤 하드웨어에서도 자유롭게 돌아가게 해 달라“며 오픈소스 AI 프레임워크인 파이토치(PyTorch)를 앞세워 엔비디아의 족쇄를 느슨하게 만들려 발버둥을 쳤다.

하지만 엔비디아의 방어막은 상상을 초월할 정도로 기민하고 촘촘했다. 경쟁사들이 1년에 한두 번 오픈소스 코드를 엉성하게 업데이트하며 개발자 커뮤니티의 불만을 살 때, 엔비디아의 수만 명짜리 소프트웨어 특수부대는 매일 수백 개의 잔버그를 직접 잡아내어 최신 CUDA 버전에 패치(Patch)해 버리는 기괴한 성실함을 보였다.
자유롭긴 하지만 남이 만들어준 싸구려 오픈소스가 늘 오류 뿜어내며 모래성처럼 무너질 때, 엔비디아는 가장 억압적이지만 결코 무너지지 않는 찬란하고 완벽한 대리석 감옥을 제공했던 것이다. 결국 거대 연합군의 그 어떤 오픈소스 반격도 이토록 완벽에 가까운 “엔비디아의 사후 최적화 지원 서비스” 앞에서는 속절없이 박살 나며 다시 쿠다의 품으로 기어들어 오게 만드는 참담한 굴욕을 반복할 뿐이었다.