16.4 철옹성 'CUDA'를 무너뜨리려는 소프트웨어 연합

16.4 철옹성 ’CUDA’를 무너뜨리려는 소프트웨어 연합

엔비디아(NVIDIA)가 지난 세월 아무리 비싼 가격 폭리를 취하며 고객의 멱살을 잡아채도 아무도 도망치지 못했던 절대적인 이유. 그것은 칩의 스펙이 압도적이어서가 아니라, 전 세계 모든 딥러닝 코드가 엔비디아의 **쿠다(CUDA, Compute Unified Device Architecture)**라는 마약 같은 프로그래밍 언어로만 짜여 있었기 때문이다. 다른 회사의 좋은 칩을 사 오면 코드가 돌아가지 않는 끔찍한 종속성, 바로 락인(Lock-in) 효과다.

이 절망적인 감옥에서 탈출하기 위해, 엔비디아에게 영원히 지갑을 털릴 운명인 글로벌 빅테크 공룡들과 반도체 경쟁자들이 구원 연합군을 결성했다. 이 연합군은 엔비디아의 하드웨어를 공격하는 대신, 그 하부 구조인 쿠다의 장벽을 부숴버리는 **‘소프트웨어 탈출 터널’**을 뚫는 데 모든 막대한 자본과 엔지니어를 쏟아붓고 있다.

이 장에서는 “어떤 칩을 사더라도 우리의 오픈소스 언어를 쓰면 다 똑같이 돌아가게 만들겠다“고 선언하며 쿠다의 독점권을 찢어발기려는 UXL 재단 연합군과, 오픈AI(OpenAI)의 천재적인 반역 기술 트리톤(Triton)이 엔비디아의 제국을 어떻게 속에서부터 허물어뜨리고 있는지 그 살 떨리는 소프트웨어 이념 전쟁의 실체를 파헤친다.

16.4.1 UXL 재단: 인텔, 구글, 퀄컴, ARM 등이 뭉친 연합 전선의 등장

각자의 영토에서 왕 노릇을 하던 실리콘밸리의 최고 권력자들이 엔비디아(NVIDIA)라는 압도적인 공공의 폭군을 무너뜨리기 위해 자존심을 버리고 하나의 테이블에 앉았다. 인텔(Intel), 구글(Google), 퀄컴(Qualcomm), 폭주하는 ARM까지. 서로 피를 튀기며 싸우던 앙숙들이 손을 맞잡고 탄생시킨 이 대(對)엔비디아 혁명 지휘부의 이름이 바로 **‘UXL(Unified Acceleration) 재단’**이다.

이들의 목표는 극도로 단순하면서도 치명적이다. “수십만 명의 개발자들이 엔비디아의 가두리 양식장인 쿠다(CUDA) 플랫폼을 탈출하여, 인텔 칩이든 구글 TPU든 퀄컴 NPU 통신칩이든 그 어떤 종류의 가속기에서도 단 한 줄의 수정 없이 코드가 매끄럽게 돌아갈 수 있는 절대적인 오픈소스 통합 표준 언어 규격을 만들겠다“는 것이다.

과거의 경쟁자들은 각자 자신만의 허접한 언어를 만들어 쿠다에 대항하려다 각개격파 당해 모조리 시체로 나뒹굴었다. 하지만 이제 막대한 자본과 안드로이드(Android)를 빚어낸 구글의 오픈소스 노하우, 인텔의 레거시 생태계가 뭉친 이 범국가적 수준의 연합 병력은 차원이 다르다. UXL 재단의 목표가 완성되는 그날, 엔비디아의 칩을 강제로 사야만 했던 소프트웨어 생태계의 족쇄는 시원하게 절단되며 철옹성에 거대한 파멸의 균열이 발생하게 될 것이다.

16.4.2 오픈AI의 트리톤(Triton): 하드웨어 종속성을 깨는 오픈소스 프로그래밍 언어의 위협

딥러닝의 복잡한 로직이 하드웨어와 가장 긴밀하게 맞붙어 싸우는 곳, 그 최하단 지하실에는 오직 엔비디아(NVIDIA)가 허락한 극소수의 쿠다(CUDA) 닌자 엔지니어들만이 코드를 만질 수 있는 폐쇄 구역이 존재했다.

하지만 세상에서 가장 똑똑한 거대 인공지능을 창조한 **오픈AI(OpenAI)**는, 남의 집 지하실 법칙(CUDA)에 영구 종속되는 것을 끔찍하게 혐오했다. 결국 그들은 이 족쇄를 찢어버리기 위해 파이썬(Python) 기반의 새로운 오픈소스 프로그래밍 언어, **‘트리톤(Triton)’**을 개발하여 세상에 통째로 공짜로 뿌려버렸다.

트리톤의 위력은 무자비하다. 악몽처럼 어렵고 변태적으로 복잡했던 쿠다의 저수준(Low-level) 메모리 최적화 코딩을, 대학생도 다룰 줄 아는 파이썬(Python) 문법으로 쉽게 대체해버린다. 더 경악스러운 것은, 트리톤으로 코드를 짜면 그 밑바탕을 받치고 있는 칩이 엔비디아 GPU인지, AMD의 칩인지, 혹은 구글의 칩인지 전혀 신경 쓸 필요 없이 소프트웨어가 알아서 최적의 성능으로 하드웨어를 자동 폭격하게 만들어 준다는 점이다. 개발자들을 하드웨어의 노예 상태에서 해방시켜버리는 이 천재적인 오픈소스의 확산은, 엔비디아가 쌓아 올린 지식 독점 시스템을 뿌리째 썩어 문드러지게 만들 가장 매섭고 소름 끼치는 암살자의 비수다.

16.4.3 개방형 프레임워크와 API가 엔비디아의 생태계 락인에 미치는 영향

결국 메타(Meta)가 주도하는 파이토치(PyTorch), 오픈AI의 트리톤(Triton), UXL 재단이 벼려내는 공통 API 명령어들의 방향성은 단 하나의 거대한 십자군 원정으로 수렴된다. 바로 **“하드웨어(Hardware)의 완전한 파편화와 범용화”**다.

과거에는 개발자가 새로운 딥러닝 아이디어를 짜려면 반드시 모니터 옆에 달린 초록색 눈알 모양 마크의 엔비디아 칩셋 로고를 쳐다보며 쿠다(CUDA) 매뉴얼을 숭배해야 했다. 이것이 엔비디아의 영업 이익률 70%를 보장해 주는 절대 락인(Lock-in) 방파제였다.

하지만 지금처럼 개발 최상위 계층의 프레임워크와 API가 플랫폼 독립적으로 묶이게 되면, 이 개방형 규격과 번역기들의 진화는 칩 자체의 정체성을 완벽하게 지워버린다. 개발자들은 내 코드가 돌아가는 서버 바닥 장판 밑에 깔린 반도체가 엔비디아인지, AMD인지, 텐스토렌트인지 알 필요도 없고 관심도 없어진다. 그저 벤치마크 테스트 표에서 **‘당장 1달러당 연산력이 가장 싼 반도체 하드웨어 부품’**을 소모품처럼 입찰받아 서버에 끼워 넣으면 그만이게 된다. 생태계의 절대 지배자에서 그저 ’원가 경쟁을 해야 하는 하드웨어 부품 납품업체’로 엔비디아의 지위가 격하될 수 있다는 것, 이것이 개방형 프레임워크 연합이 젠슨 황(Jensen Huang)의 목숨줄을 겨누고 들이대는 가장 현실적이고 사악한 단두대의 칼날이다.