NVIDIA Edify는 단일 생성형 AI 모델을 지칭하는 용어가 아니다. 이는 이미지, 비디오, 3D 에셋, 360도 고명암 대비(HDRi), 물리 기반 렌더링(PBR) 재질 등 광범위한 시각적 콘텐츠 생성을 목표로 설계된 포괄적인 멀티모달(multimodal) AI 아키텍처로 정의해야 한다.1 이러한 정의는 NVIDIA가 특정 애플리케이션 개발을 넘어, 시각 생성 AI 기술의 근간을 이루는 핵심 기술 스택을 구축하고자 했음을 명확히 보여준다. Edify는 라플라시안 확산(Laplacian diffusion)이나 다중 시점(multi-view) 3D 생성과 같은 기술적 혁신을 선보였을 뿐만 아니라, ‘상업적 안전성(commercially safe)’이라는 명확한 가치 제안을 통해 기업 시장을 정밀하게 공략한 선구적 시도였다.3 생성형 AI 시장 초기에 저작권 문제가 첨예한 법적, 윤리적 쟁점으로 부상했을 때, 이는 Edify를 경쟁 모델과 차별화하는 핵심 요소로 작용했다.
본 보고서는 Edify의 기술적 근간을 심층적으로 해부하고(제1부), NVIDIA의 거대한 AI 생태계 내에서 Edify가 수행했던 전략적 역할을 분석하며(제2부), 치열한 경쟁 환경 속에서 Edify가 차지했던 독자적인 위치를 조명한다(제3부). 마지막으로, Edify NIM(NVIDIA Inference Microservice) 프리뷰 서비스의 중단이 가지는 의미를 다각도로 해석하고, 이를 통해 NVIDIA의 거시적인 생성형 AI 전략이 어떻게 진화하고 있는지를 추적함으로써 Edify가 남긴 기술적, 전략적 유산을 종합적으로 평가하고자 한다(제4부).
Edify 아키텍처의 2D 이미지 생성 부문을 담당하는 Edify Image는 기존 확산 모델의 패러다임에서 벗어난 독자적인 접근법을 채택했다. Stable Diffusion과 같은 주류 모델들이 VAE(Variational Autoencoder)를 이용해 고차원의 이미지 데이터를 저차원의 잠재 공간(latent space)으로 압축하여 처리하는 방식을 사용하는 것과 대조적으로, Edify Image는 원본 이미지의 픽셀 공간(pixel space)에서 직접 작동하는 방식을 선택했다.5 이러한 선택은 모델의 기술적 정체성과 직결된다.
Edify Image의 핵심 혁신은 ‘라플라시안 확산 모델’이라는 새로운 개념에 있다. 이 모델의 근본적인 아이디어는 이미지 신호를 주파수 대역별로 분해하고, 각 대역에 서로 다른 감쇠율(attenuation rate)을 적용하여 노이즈를 추가하는 새로운 확산 프로세스를 제안하는 것이다.5 이는 이미지의 거시적 구조를 담고 있는 저주파 정보와 섬세한 디테일을 담고 있는 고주파 정보를 시간 축에 따라 다르게 처리함으로써, 생성 과정 전반에 걸쳐 세부 묘사의 정밀도를 극대화하려는 시도이다.
수학적으로 이 과정은 다음과 같이 공식화할 수 있다. 원본 이미지 $\mathbf{x}_0$를 라플라시안 피라미드(Laplacian pyramid) 기법을 통해 여러 주파수 대역 $\mathbf{x}_0^{(i)}$로 분해한다. 이후 특정 시간 $t$에서의 노이즈가 추가된 이미지 $\mathbf{x}_t$는 각 주파수 대역에 서로 다른 감쇠 계수 $\alpha_t^{(i)}$를 적용한 신호의 합으로 정의된다.6 \(\mu(\mathbf{x}_0, t) = \sum_{i} \alpha_t^{(i)} \mathbf{x}_0^{(i)}\)
\[\mathbf{x}_t = \mu(\mathbf{x}_0, t) + \sigma_t \epsilon\]여기서 핵심은 고주파 대역에 해당하는 감쇠 계수 $\alpha_t^{(i)}$가 저주파 대역의 계수보다 더 빠르게 0에 수렴하도록 설계하는 것이다. 이로 인해 확산 과정의 초기 단계(시간 $t$가 작을 때)에서는 고주파 정보가 빠르게 소멸되고 저주파 구조 정보가 상대적으로 오래 보존된다. 역으로, 이미지 생성(denoising) 과정에서는 초기 단계에서 전체적인 구조를 먼저 복원하고, 후반부로 갈수록 점차 고주파 디테일을 정교하게 복원하는 계층적 생성이 가능해진다.
Edify Image는 저해상도 이미지를 생성하는 기본 모델과, 이를 입력받아 점진적으로 해상도를 높이는 여러 후속 모델들로 구성된 계단식(cascaded) 아키텍처를 사용한다.6 라플라시안 확산 모델은 이러한 구조에서 발생하기 쉬운 아티팩트 누적 문제를 효과적으로 완화한다. 일반적인 계단식 모델에서 업샘플링 단계는 단순히 픽셀 수를 늘리는 데 초점을 맞추는 경우가 많지만, Edify Image의 후속 모델들은 이전 단계에서 감쇠되었던 특정 고주파 대역의 정보를 복원하는 명확한 목표를 가지고 훈련되기 때문이다.
이러한 기술적 선택은 단순한 학술적 시도를 넘어 명확한 전략적 목표를 가진다. 잠재 공간 모델은 VAE 인코더와 디코더 과정에서 미세한 정보 손실이나 아티팩트가 발생할 위험이 있다. 특히 이미지 내 텍스트 렌더링이나 복잡한 질감 표현에서 이러한 한계가 드러나곤 한다. 반면, 픽셀 공간에서 직접 작동하고 다중 스케일 처리를 통해 정밀도를 높인 Edify Image는 ‘픽셀 수준의 정확성(pixel-perfect accuracy)’을 달성할 수 있으며, 이는 결과물의 품질과 신뢰성이 무엇보다 중요한 상업용 및 기업용 애플리케이션 시장의 요구에 정확히 부합하는 아키텍처 선택이라 할 수 있다.5
Edify 3D는 3D 에셋 생성 분야에서 고질적인 문제로 지적되어 온 고품질 3D 학습 데이터의 부족 문제를 해결하기 위해, 2D 이미지 생성 기술을 중간 단계로 활용하는 독창적인 2단계 파이프라인을 채택했다.10
Edify 3D의 핵심 목표는 단순히 3D 형태를 만드는 것을 넘어, 전문 아티스트들이 후반 작업에서 즉시 활용할 수 있는 ‘생산 준비된(production-ready)’ 에셋을 제공하는 것이었다. 이를 위해 모델은 ‘깨끗한 사변형 기반 토폴로지(clean quads-based topology)’와 자동화된 UV 매핑 기능을 제공하도록 설계되었다.3 이는 많은 초기 3D 생성 도구들이 불규칙한 삼각형 메시(tri-mesh)나 소위 ‘녹아내린 치즈’처럼 보이는 비정형적 형태를 출력하여 후속 작업에 어려움을 주었던 것과 명확히 대조되는 지점이다.12
Edify 3D의 이러한 설계 철학은 NVIDIA의 더 큰 비전, 즉 산업 메타버스 플랫폼인 ‘Omniverse’ 및 ‘디지털 트윈’ 전략과 깊은 연관성을 가진다. 생성된 에셋이 PBR 재질과 깨끗한 기하 구조를 갖춘다는 것은, 이 에셋들이 Omniverse와 같은 시뮬레이션 환경 내에서 물리적으로 정확하게 상호작용할 수 있는 ‘SimReady’ 에셋으로 기능할 수 있음을 의미한다.13 이는 Edify 3D가 단순한 콘텐츠 제작 도구를 넘어, NVIDIA의 산업 메타버스 생태계를 풍부하게 채우기 위한 핵심적인 에셋 생성 파이프라인으로 기획되었음을 시사한다. 즉, Edify 3D는 NVIDIA의 하드웨어(GPU), 플랫폼(Omniverse), 그리고 콘텐츠(생성형 AI)로 이어지는 거대한 수직 통합 전략에서 핵심적인 연결고리 역할을 수행하도록 설계된 것이다.
NVIDIA는 Edify를 통해 완성된 AI 모델을 판매하는 것을 넘어, ‘AI 모델 생성’ 자체를 서비스화(Model-as-a-Service)하려는 야심 찬 전략을 펼쳤다. 그 중심에는 ‘NVIDIA AI Foundry’라는 개념이 있다. 이는 마치 반도체 파운드리 기업 TSMC가 팹리스 기업들의 설계를 받아 칩을 제조해주듯, NVIDIA가 기업들의 고유 데이터를 활용하여 맞춤형 AI 모델을 개발하고 운영할 수 있도록 지원하는 플랫폼 및 서비스를 의미한다.14
이 파운드리 생태계에서 Edify는 기업들이 활용할 수 있는 핵심적인 파운데이션 아키텍처로 기능했다.2 기업들은 잘 훈련된 일반 Edify 모델을 기반으로 시작하여, 자사의 독점적인 데이터셋을 이용해 미세조정(fine-tuning)을 거침으로써 자사의 브랜드 스타일과 고유한 지적 재산(IP)이 반영된 맞춤형 생성 모델을 구축할 수 있었다. 초기에는 이 서비스가 ‘NVIDIA Picasso’라는 이름의 클라우드 서비스로 발표되었으며, Edify는 그 안에 포함된 핵심 모델 아키텍처였다.2 시간이 지나면서 ‘Picasso’라는 브랜드는 점차 더 넓은 개념인 ‘Edify’ 또는 ‘AI Foundry’로 통합 및 대체된 것으로 보인다.15
이러한 접근법은 AI 시장의 주도권을 모델 개발사가 아닌, 모델 개발을 가능하게 하는 ‘인프라 및 플랫폼 제공자’인 NVIDIA가 확보하려는 정교한 전략적 포석이다. 모든 기업이 처음부터 파운데이션 모델을 훈련하는 것은 막대한 비용과 전문성을 요구한다. NVIDIA는 이미 최적화된 파운데이션 아키텍처(Edify)와 세계 최고 수준의 훈련 인프라(DGX Cloud)를 보유하고 있으므로 2, 기업은 자신들의 핵심 자산인 ‘데이터’만 제공하면 된다. NVIDIA AI Foundry는 이 둘을 결합하여 맞춤형 모델을 ‘생산’해주는 공장 역할을 수행하며, 이를 통해 NVIDIA는 단순한 GPU 판매자를 넘어 모든 기업의 AI 전환 과정에 깊숙이 관여하는 핵심 파트너로 자리매김하게 된다.
Edify의 전략에서 파트너십은 단순한 기술 협력을 넘어, 그 자체로 핵심적인 가치 제안이었다. 이는 생성형 AI 시장의 ‘데이터 전쟁’에서 NVIDIA가 선택한 독특한 경로를 보여준다.
이러한 파트너십들은 웹 스크래핑에 기반한 ‘양’의 경쟁(예: Stable Diffusion) 대신, 라이선스 계약을 통한 ‘질’과 ‘법적 안정성’의 경쟁을 선택한 NVIDIA의 전략을 명확히 보여준다. 이는 기술력만으로는 쉽게 모방할 수 없는 강력한 해자를 구축하며, 특히 법적 리스크에 민감한 대기업 시장을 효과적으로 공략하는 데 결정적인 역할을 했다. 즉, 이 파트너십들은 Edify의 기술을 상용화하는 통로이자, Edify의 핵심 가치인 ‘신뢰’를 보증하는 증표로서 기능했다.
Edify는 단순한 텍스트 프롬프트를 넘어, 사용자가 생성 과정을 보다 정밀하고 의도적으로 제어할 수 있는 다양한 고급 기능을 제공하고자 했다.2
이러한 제어 기능들은 생성형 AI를 ‘우연의 산물’을 만드는 도구에서 ‘창작자의 의도를 정확히 구현’하는 전문적인 도구로 격상시키려는 시도였다. 이는 AI를 창작 과정의 단순한 대체재가 아닌, 창의성을 증폭시키는 보조자(co-pilot)로 활용하려는 전문가들의 요구에 부응하는 것이며, AI 기술이 기존의 전문 창작 워크플로우에 자연스럽게 통합되기 위한 필수적인 진화 방향을 제시했다.
Edify의 전략적 포지셔닝을 명확히 이해하기 위해서는, 동시대의 주요 경쟁 플랫폼인 Adobe Firefly, Midjourney, Stable Diffusion과의 다각적인 비교 분석이 필수적이다. 아래 표는 각 플랫폼의 핵심 기술, 주요 기능, 학습 데이터 소스, 상업적 안전성, 라이선스 모델, 그리고 주요 타겟 고객을 기준으로 비교 분석한 결과이다.
이 비교 분석표는 복잡한 생성형 AI 시장의 지형도를 한눈에 보여준다. 각 플랫폼은 서로 다른 기술적, 사업적 선택을 통해 자신만의 독자적인 시장 영역을 구축하려 했다. Edify와 Adobe Firefly는 ‘상업적 안전성’과 ‘기업 시장’이라는 공통분모를 가지지만, Edify는 3D 생성과 파운드리 서비스라는 차별점을, Firefly는 자사의 강력한 크리에이티브 소프트웨어 생태계와의 깊은 통합을 강점으로 내세웠다. 반면 Midjourney는 타의 추종을 불허하는 예술적 품질과 독창적인 스타일로 개인 창작자 시장을 장악했고, Stable Diffusion은 완전한 개방성과 무한한 확장성을 무기로 개발자와 AI 커뮤니티의 지지를 받았다. 이 표는 Edify의 전략이 왜 ‘기업용 고품질, 고신뢰성, 멀티모달 생성 솔루션’이라는 특정 니치 시장을 목표로 했는지를 명확하게 입증하는 핵심 자료이다.
| 기능 (Feature) | NVIDIA Edify | Adobe Firefly | Midjourney | Stable Diffusion |
|---|---|---|---|---|
| 핵심 기술 (Core Tech) | 라플라시안/다중 시점 확산 5 | 독자적 확산 모델 24 | 독자적 확산 모델 25 | 잠재 공간 확산 (Latent Diffusion) 8 |
| 주요 기능 (Key Features) | 2D, 3D, 360 HDRi, PBR, 미세조정 2 | 2D, 벡터, 비디오, 미세조정, 스타일 키트 24 | 2D 이미지, 스타일/캐릭터 참조, Pan/Zoom 27 | 2D 이미지, In/Outpainting, ControlNet, LoRA 8 |
| 데이터 소스 (Data Source) | 라이선스 계약 (Shutterstock, Getty) 3 | Adobe Stock, 공개 도메인, 텍스트 효과는 Adobe Fonts 29 | 웹 데이터 기반 (추정) 28 | LAION 등 대규모 웹 데이터셋 8 |
| 상업적 안전성 | 매우 높음 (파트너사를 통한 IP 면책) 4 | 높음 (기업용 플랜에 IP 면책 제공) 29 | 사용자 책임 원칙 30 | 라이선스 및 모델에 따라 다름 32 |
| 라이선스 모델 | 파운드리 서비스 (B2B) 2 | 구독 기반 (생성 크레딧 시스템) 26 | 구독 기반 (GPU 시간 기반) 27 | 오픈소스 / 커뮤니티 / 상업용 라이선스 혼재 32 |
| 주요 대상 | 대기업, 콘텐츠 제공업체, 개발자 2 | 크리에이터, 마케터, 기업 29 | 아티스트, 디자이너, 개인 사용자 28 | 개발자, 연구자, AI 커뮤니티, 스타트업 8 |
2025년 6월 6일을 기점으로, Edify가 더 이상 NVIDIA NIM(NVIDIA Inference Microservice) 프리뷰 형태로 제공되지 않는다는 공지가 다수의 NVIDIA 공식 블로그와 문서를 통해 반복적으로 확인되었다.1 대신 사용자들은 build.nvidia.com에서 제공되는 다양한 시각 AI 모델들을 탐색하도록 안내받고 있다.
이러한 변화를 Edify 프로젝트의 ‘실패’나 ‘폐기’로 해석하는 것은 사안의 본질을 놓치는 피상적인 분석이다. Edify 아키텍처는 여전히 Shutterstock과 같은 핵심 파트너사들의 상용 서비스에 깊숙이 통합되어 있으며 18, NVIDIA Omniverse의 차세대 Blueprint 워크플로우에서도 중요한 구성 요소로 활용되고 있다.39
Edify NIM 프리뷰의 중단은 특정 브랜드 모델을 전면에 내세우는 ‘제품 중심 전략’에서, NVIDIA와 서드파티의 모든 AI 모델을 손쉽게 배포하고 실행할 수 있도록 지원하는 ‘플랫폼 중심 전략’으로의 거시적인 전환을 의미한다. NVIDIA의 핵심 비즈니스는 GPU 하드웨어 판매이며, 이를 극대화하기 위해서는 가능한 한 많은 소프트웨어와 AI 모델이 자사 하드웨어 상에서 가장 효율적으로 실행되도록 만들어야 한다. 시장 초기에는 Edify라는 플래그십 모델을 통해 NVIDIA의 기술적 비전과 ‘상업적 안전성’이라는 가치를 시장에 각인시킬 필요가 있었다. 그러나 시장이 성숙함에 따라 Stable Diffusion, Llama, FLUX.1 등 수많은 강력한 오픈소스 및 상용 모델들이 등장했다.41 이 모든 모델과 개별적으로 경쟁하는 것은 비효율적이다.
대신, 이 모든 모델들을 표준화된 컨테이너 형태로 최적화하여 배포할 수 있는 NIM이라는 ‘운송 수단’을 제공하는 것이 훨씬 더 강력하고 확장성 있는 전략이다.43 이제 시장에서 어떤 모델이 최종 승자가 되든, 그 모델이 NIM을 통해 NVIDIA GPU 위에서 실행된다면 NVIDIA는 결국 승리하게 된다. 이는 PC 시장에서 Microsoft가 특정 하드웨어 제조사와 경쟁하는 대신 Windows라는 운영체제 플랫폼을 제공하여 시장 전체를 장악했던 전략과 유사하다. 따라서 Edify NIM의 중단은 Edify의 가치가 소멸했기 때문이 아니라, Edify라는 개별 ‘승객’을 내세우기보다 모든 승객을 태울 수 있는 ‘NIM이라는 기차 시스템’ 자체를 전면에 내세우는 것이 더 큰 전략적 이점을 가지게 되었기 때문으로 해석해야 한다.
Edify NIM 중단 이후 NVIDIA가 제시하는 방향성은 명확하다. 이는 개방성, 통합, 그리고 지속적인 연구 개발이라는 세 가지 축으로 요약할 수 있다.
build.nvidia.com - 새로운 AI 모델 허브: 이 포털은 NVIDIA의 새로운 플랫폼 전략을 상징하는 공간이다. 개발자들은 이곳에서 NVIDIA가 직접 개발한 모델뿐만 아니라 Stability AI, Black Forest Labs 등 다양한 파트너사들이 제공하는 최신 모델들을 NIM 형태로 자유롭게 탐색하고 배포할 수 있다.41 이는 선택의 폭을 넓혀 개발자 생태계를 NVIDIA 플랫폼으로 유인하고, 특정 모델에 대한 종속성을 줄이는 역할을 한다.Edify는 비록 전면에 나서는 브랜드는 아니게 되었지만, NVIDIA의 AI 전략에 지울 수 없는 유산을 남겼다.
NVIDIA Edify의 여정은 특정 AI 모델의 흥망성쇠를 넘어, 생성형 AI 시장의 동적인 변화에 대응하는 한 기술 거인의 정교한 전략적 진화를 보여주는 사례이다. Edify는 특정 모델의 이름이기보다, NVIDIA가 생성형 AI 애플리케이션 시장에 진입하기 위해 내세웠던 기술적 비전과 전략적 접근법의 총체였다. 이 아키텍처는 선도적인 기술력을 과시하고, ‘상업적 안전성’이라는 새로운 시장을 개척했으며, 핵심 파트너십을 구축하는 데 성공적으로 기여했다.
Edify NIM 프리뷰의 중단은 프로젝트의 종결이 아닌, 성공적인 파일럿 프로젝트 완료 후 더 큰 규모의 본 프로젝트, 즉 NIM 플랫폼 생태계 구축으로 확장하는 자연스러운 전략적 진화 과정으로 해석하는 것이 타당하다. NVIDIA는 ‘최고의 AI 모델’을 직접 만드는 경쟁에 매몰되기보다, ‘모든 AI 모델을 위한 최고의 플랫폼’을 제공함으로써 게임의 규칙 자체를 바꾸고 있다.
향후 NVIDIA는 특정 모델 브랜드를 전면에 내세우기보다는, build.nvidia.com과 NIM을 통해 개방형 모델 생태계를 적극적으로 지원하고, Omniverse와 같은 자사 플랫폼과의 심층적인 통합을 통해 고부가가치 산업 애플리케이션 시장에서의 지배력을 강화하려 할 것이다. 이 과정에서 Edify가 개척했던 ‘신뢰할 수 있는 AI’라는 가치는 NVIDIA의 모든 생성형 AI 전략의 기저에 흐르는 핵심 원칙으로 계속해서 중요한 역할을 수행할 것이다.
| NVIDIA Edify, a Cloud-Based Generative AI Service for Creating Images, Videos, and 3D Applications D52672 | GTC Digital Spring 2023 | NVIDIA On-Demand, 8월 23, 2025에 액세스, https://www.nvidia.com/en-us/on-demand/session/gtcspring23-d52672/ |
| Edify 3D: Scalable High-Quality 3D Asset Generation | OpenReview, 8월 23, 2025에 액세스, https://openreview.net/forum?id=KJ8MUtjWj0&referrer=%5Bthe%20profile%20of%20Donglai%20Xiang%5D(%2Fprofile%3Fid%3D~Donglai_Xiang1) |
| Custom Models for Generative AI | NVIDIA AI Foundry, 8월 23, 2025에 액세스, https://www.nvidia.com/en-us/ai/foundry/ |
| How to use Midjourney | Zapier, 8월 23, 2025에 액세스, https://zapier.com/blog/how-to-use-midjourney/ |
| Adobe Firefly | Comprehensive & Commercially Safe AI Content Creation for Businesses, 8월 23, 2025에 액세스, https://business.adobe.com/products/firefly-business/firefly-ai-approach.html |
| Explore Visual Design Models | Try NVIDIA NIM APIs, 8월 23, 2025에 액세스, https://build.nvidia.com/explore/visual-design |
| Check out LATTE3D, NVIDIA’s peppy new text-to-3D AI model | CG Channel, 8월 23, 2025에 액세스, https://www.cgchannel.com/2024/03/check-out-latte3d-nvidias-peppy-new-text-to-3d-ai-model/ |