16.1 전통적 라이벌의 반격

16.1 전통적 라이벌의 반격

초창기 PC 시절부터 젠슨 황(Jensen Huang)과 함께 실리콘밸리 반도체의 피비린내 나는 참호를 뒹굴었던 늙은 경쟁자들은 결코 멸종하지 않았다. 인텔(Intel)이 모바일의 도래를 외면하다 추락하는 긴 세월 동안, 그리고 AMD가 파산의 문턱을 넘나들며 시체처럼 쓰러져 있던 시간 동안 엔비디아(NVIDIA)는 AI라는 우주의 왕좌에 무혈입성했다.

하지만 숨통을 끊어 놓지 않은 적은 반드시 가장 날카로운 비수를 들고 되돌아온다. 리사 수(Lisa Su)라는 걸출한 여제를 등에 업고 기적적으로 부활한 AMD는, 이제 CPU 시장의 파이를 넘어 엔비디아의 유일하고도 가장 위협적인 맞수가 되어 데이터센터 GPU 시장의 성벽을 직격으로 부수고 들이닥치고 있다. 한때 반도체의 제왕이었으나 몰락의 수모를 겪은 인텔 역시 “가성비“라는 치졸하지만 강력한 무기를 들고 왕좌의 탈환을 벼르고 있다.

이 장에서는 엔비디아의 스펙트럼에서 유일하게 하드웨어와 소프트웨어 두 측면 모두에서 동급의 화력으로 전면전을 걸어올 수 있는 전통적 포식자들의 파괴적인 아키텍처 역습과, 그들이 겨누고 있는 엔비디아의 가격 폭리라는 치명적 약점을 낱낱이 파헤친다.

16.1.1 영원한 맞수 AMD: 인스팅트(Instinct) MI 시리즈의 맹추격

지구상에서 엔비디아(NVIDIA)의 H100이나 블랙웰(Blackwell) 칩과 1대 1 하드웨어 힘 싸움을 벌여서 스펙상 뼈가 부러지지 않고 맞붙을 수 있는 기업은 단 한 곳, AMD뿐이다. 리사 수(Lisa Su)가 지휘하는 AMD는 더 이상 인텔의 저가형 대체품이 아니라, 인공지능 슈퍼컴퓨터의 코어를 깎아내는 무자비한 괴물 공장으로 진화했다.

AMD가 벼르고 벼려 쏘아 올린 대항마 **‘인스팅트 MI300X(Instinct MI300X)’**는 스펙 표만으로도 엔비디아의 등골을 서늘하게 만든다. MI300X는 H100보다 약 2.4배 달하는 막대한 192GB의 HBM3 대용량 메모리를 탑재하여, 데이터 펌핑 능력을 강제 스케일업(Scale-up) 시켰다. LLM(초거대 언어 모델)의 추론(Inference) 과정에서 가장 뼈아픈 병목 현상은 연산력이 아니라 메모리 용량의 한계에서 온다는 치명타를 정확하게 노린 것이다. 똑같은 파라미터 묶음을 연산할 때 엔비디아 하드웨어를 여러 장 겹쳐야 하는 비용을, AMD는 단 한 개의 칩셋 거대 용량으로 뭉텅이로 처리해 버릴 수 있다고 압박하며 고객들의 장부책 지출 내역을 노골적으로 유혹하고 있다. 하드웨어의 순수 체급 면에서 이미 엔비디아의 멱살을 잡아 끈 AMD의 맹추격은 시장에 훌륭한 독점 파괴 선봉장으로 자리 잡았다.

16.1.2 AMD ROCm 생태계의 진화와 CUDA 대체 가능성

하지만 하드웨어 마블링이 아무리 훌륭해도 요리할 수 있는 칼(소프트웨어)이 썩어 있다면 도축장 밖을 나설 수 없다. AMD가 지난 10년간 번번이 엔비디아(NVIDIA)의 발밑에서 짓밟혔던 본질적인 이유는, GPU 스펙이 뒤져서가 아니라 엔비디아가 깔아놓은 절대 마약 **쿠다(CUDA)**라는 프로그래밍 생태계의 벽을 도저히 넘어서지 못했기 때문이다. 지구상의 모든 AI 개발자들은 쿠다 언어의 노예로 길들여져 있었다.

이를 타개하기 위해 AMD는 수십조 원의 피를 흘리며 자사의 가속 플랫폼 **ROCm(Radeon Open Compute)**의 엔진을 갈아버리고 있다. 초창기 버그 투성이에 호환성 쓰레기 취급을 받던 ROCm은, 이제 허깅페이스(Hugging Face), 파이토치(PyTorch) 등 AI 생태계의 핵심 저류(오픈소스 프레임워크)들과 직접 브릿지를 뚫어내며 “이제 우리 칩에서도 딥러닝 코드가 아무 오류 없이 똑같이 돌아간다“는 것을 악착같이 증명해 내고 있다.

특히 개발자들이 기존 엔비디아 쿠다 기반의 코드를 AMD 플랫폼용으로 자동 번역 이식해 주는 마이그레이션(Migration) 도구들의 정확도가 비약적으로 올라오고 있다. 이 마법의 번역기가 완벽해지는 순간, 쿠다(CUDA)라는 철옹성이 지니고 있던 강제적인 하드웨어 락인(Lock-in) 족쇄는 시원하게 박살 난다. ROCm의 진화는 단순한 소프트웨어 패치가 아니라, 엔비디아 제국의 담장을 파괴하는 가장 무거운 공성추다.

16.1.3 인텔의 절치부심: 가우디(Gaudi) 라인업을 앞세운 가성비 전략

한때 지구상의 모든 PC와 서버의 뇌를 지배했던 제왕, 인텔(Intel). 모바일과 AI라는 양대 패러다임을 모두 놓치며 몰락의 능욕을 겪고 있는 이 늙은 사자는, 엔비디아(NVIDIA)를 상대로 가장 자존심 상하지만 가장 실용적인 흙탕물 싸움을 걸어왔다. 바로 전면적인 성능 맞불이 아닌, 살인적인 가성비(가격 대비 성능) 타격 전략이다.

인텔이 팹리스 스타트업 하바나 랩스(Habana Labs)를 인수하며 손에 넣은 AI 가속기 가우디(Gaudi) 라인업(가우디 2, 가우디 3)은 냉정하게 말해 엔비디아 H100의 극단적인 TFLOPS 연산력을 압도하지는 못한다. 그러나 인텔은 노골적으로 외친다. “수백억 달러의 딥러닝 모델 훈련이 아니라 기업들의 적당한 크기의 AI 추론 모델을 돌릴 거라면, 왜 저렇게 징그럽게 비싼 엔비디아 칩에 당신의 돈줄을 바치는가? 우리의 가우디는 H100 가격의 3분의 1 수준에 성능은 크게 뒤처지지 않는다.”

엔비디아의 70%에 달하는 기괴한 영업 이익률 마진은 고객사들에게 끔찍한 세금 납부와 같다. 인텔은 이 원성을 교묘하게 파고들어, “성능 타협“을 담보로 한 저비용 대안재로써의 입지를 맹렬히 구축하고 있다. 오직 스펙의 극단만을 향해 질주하는 하이엔드 시장 옆에서, 가우디는 가벼움을 무기로 거대 클라우드 업체들의 비용 절감 예산을 뜯어먹고 자라나는 가장 지독하고 현실적인 하단 생태계의 기생충이자 위협이다.