NVIDIA DRIVE AGX Orin 배어메탈 하이퍼바이저
1. 소프트웨어 정의 차량(SDV) 시대의 가상화 기술
1.1 현대 자동차 E/E 아키텍처의 패러다임 전환
현대 자동차 산업은 소프트웨어 정의 차량(Software-Defined Vehicle, SDV)으로의 전환이라는 거대한 패러다임 변화를 겪고 있다. 과거의 차량 아키텍처는 개별 기능을 전담하는 수십, 수백 개의 분산된 전자제어장치(Electronic Control Unit, ECU)에 의존했다.1 이러한 구조는 시스템 복잡성 증가, 차량 무게 및 배선 비용 상승, 소프트웨어 업데이트의 어려움 등 명백한 한계에 직면했다.2 이에 대한 해결책으로 여러 ECU의 기능을 소수의 고성능 도메인 컨트롤러 또는 단일 중앙 집중형 컴퓨터로 통합하는 아키텍처가 부상했다.4
이러한 전환의 중심에는 NVIDIA DRIVE AGX Orin과 같은 고성능 컴퓨팅 플랫폼이 있다. Orin 시스템 온 칩(SoC)은 차세대 GPU 아키텍처와 Arm Cortex-A78AE CPU 코어를 통합하여 최대 254 TOPS(INT8)에 달하는 막대한 연산 성능을 제공한다.5 이 강력한 성능은 첨단 운전자 보조 시스템(ADAS), 자율주행(AD), 그리고 풍부한 그래픽의 디지털 콕핏과 같은 복잡한 기능들을 단일 플랫폼에서 동시에 처리할 수 있는 기술적 기반을 마련한다.7
1.2 혼합 중요도(Mixed-Criticality) 시스템 통합의 도전 과제
중앙 집중형 컴퓨팅 환경은 필연적으로 ‘혼합 중요도(Mixed-Criticality)’ 시스템이라는 복잡한 과제를 동반한다. 이는 단일 SoC 내에서 서로 다른 수준의 안전성 요구사항을 가진 여러 소프트웨어 애플리케이션을 동시에 실행해야 함을 의미한다. 예를 들어, 오작동 시 심각한 위험을 초래할 수 있는 디지털 계기판의 경고등 표시나 ADAS의 긴급 제동 신호는 ISO 26262 표준에 따라 높은 수준의 기능 안전성(ASIL B 또는 ASIL D)을 요구한다.1 반면, 인포테인먼트(IVI) 시스템이나 커넥티비티 서비스는 상대적으로 낮은 안전성 요구사항(QM, Quality Managed)을 갖는다.2
이러한 혼합 중요도 시스템을 안전하게 통합하기 위한 가장 큰 도전 과제는 ’간섭(Interference)’을 방지하는 것이다. 즉, 인포테인먼트 시스템의 소프트웨어 오류나 비정상적인 자원 점유가 계기판이나 ADAS와 같은 안전-필수(safety-critical) 기능의 정상적인 동작을 방해해서는 안 된다.
1.3 배어메탈 하이퍼바이저의 핵심 역할과 가치
이러한 간섭 문제를 해결하고 혼합 중요도 시스템의 안전한 통합을 가능하게 하는 핵심 기술이 바로 타입 1(Type 1), 즉 ‘배어메탈(Bare-metal)’ 하이퍼바이저다. 타입 2 하이퍼바이저가 호스트 운영체제(OS) 위에서 실행되는 것과 달리, 타입 1 하이퍼바이저는 물리적 하드웨어에 직접 설치되어 OS 없이 독립적으로 동작한다.10 이 구조는 OS 계층으로 인한 오버헤드를 제거하여 월등히 높은 성능과 강화된 보안을 제공한다.12
자동차 시스템에서 배어메탈 하이퍼바이저의 가장 중요한 가치는 가상 머신(Virtual Machine, VM) 간의 강력한 ’공간적 및 시간적 분리(Spatial and Temporal Isolation)’를 보장하는 능력에 있다.15
-
공간적 분리(Spatial Isolation): 하이퍼바이저는 각 VM에 독립적인 메모리 공간을 할당하고 하드웨어 메모리 관리 장치(MMU)를 통해 접근을 엄격히 통제한다. 이를 통해 하나의 VM이 다른 VM의 메모리 영역을 침범하는 것을 원천적으로 차단한다.18
-
시간적 분리(Temporal Isolation): 하이퍼바이저는 CPU 시간을 정밀하게 스케줄링하여 각 VM이 할당된 시간만큼 CPU 자원을 사용할 수 있도록 보장한다. 이로써 특정 VM의 과도한 CPU 사용이 다른 실시간-필수 VM의 실행을 지연시키는 것을 방지한다.18
이러한 강력한 분리 기능은 ISO 26262 기능 안전 표준의 핵심 요구사항인 ’간섭으로부터의 자유(Freedom from Interference)’를 달성하는 기술적 근간이 된다.1 결과적으로 하이퍼바이저는 여러 ECU를 단일 SoC로 통합하여 비용, 무게, 전력 소비(SWaP-C)를 절감하고, 소프트웨어의 재사용성을 높여 개발 효율성을 극대화하는 경제적, 공학적 이점을 제공한다.1
2. 하드웨어 가상화 기반 기술: ARMv8-A 아키텍처
DRIVE Orin 플랫폼의 가상화 능력은 SoC에 내장된 Arm Cortex-A78AE 코어의 ARMv8-A 아키텍처가 제공하는 하드웨어 가상화 지원에 깊이 뿌리내리고 있다. 하이퍼바이저는 이 하드웨어 기능을 활용하여 소프트웨어만으로는 달성하기 어려운 수준의 성능과 격리 수준을 구현한다.
2.1 예외 레벨(Exception Levels)과 하이퍼바이저 모드
ARMv8-A 아키텍처는 소프트웨어 실행 권한을 4개의 예외 레벨(Exception Level, EL)로 정의한다.21
-
EL0: 일반 사용자 애플리케이션이 실행되는 가장 낮은 권한 수준.
-
EL1: 운영체제(OS) 커널이 실행되는 권한 수준.
-
EL2: 하이퍼바이저가 실행되는 권한 수준으로, 가상화를 위해 특별히 설계되었다.
-
EL3: 시스템의 보안 상태를 관리하는 시큐어 모니터(Secure Monitor)가 실행되는 가장 높은 권한 수준.
타입 1 하이퍼바이저는 EL2에서 실행되며, EL1에서 동작하는 여러 게스트 OS를 관리하고 제어한다.23 EL2는 게스트 OS의 시스템 레지스터 접근이나 특정 명령어 실행을 가로채는 ‘트랩(trap)’ 기능을 하드웨어적으로 지원하여, 하이퍼바이저가 각 VM의 상태를 완벽하게 통제하고 격리할 수 있도록 한다.25 DRIVE Orin의 Cortex-A78AE 코어는 ARMv8.2 아키텍처를 기반으로 하여 이러한 하드웨어 가상화 확장을 완벽하게 지원한다.6
2.2 CPU 및 메모리 가상화 메커니즘
하이퍼바이저는 CPU와 메모리 자원을 가상화하여 각 VM이 독립적인 컴퓨팅 환경을 소유한 것처럼 보이게 한다.
-
CPU 가상화: 하이퍼바이저는 물리적 CPU 코어를 VM에 할당하는 다양한 전략을 사용한다. 비대칭 멀티프로세싱(Asymmetric Multiprocessing, AMP) 방식에서는 특정 CPU 코어를 특정 VM에 고정 할당하여 예측 가능성을 높인다. 반면, 대칭 멀티프로세싱(Symmetric Multiprocessing, SMP) 방식에서는 하이퍼바이저 스케줄러가 여러 VM의 가상 CPU(vCPU)를 물리적 CPU 코어에 동적으로 분배하여 자원 활용률을 극대화한다.
-
메모리 가상화: ARMv8-A의 핵심적인 메모리 가상화 기능은 ’2단계 주소 변환(Stage 2 Translation)’이다. 게스트 OS는 가상 주소(Virtual Address, VA)를 중간 물리 주소(Intermediate Physical Address, IPA)로 변환하는 자신만의 페이지 테이블(Stage 1)을 관리한다. 이후 하이퍼바이저는 이 IPA를 실제 물리 주소(Physical Address, PA)로 변환하는 별도의 페이지 테이블(Stage 2)을 제어한다. 이 2단계 과정을 통해 하이퍼바이저는 각 VM의 메모리 접근을 하드웨어 수준에서 완벽하게 격리하여 공간적 분리를 달성한다.
-
SMMU (System Memory Management Unit): SMMU는 CPU가 아닌 다른 DMA(Direct Memory Access) 가능 장치들(예: GPU, 이더넷 컨트롤러, 스토리지 컨트롤러)을 위한 MMU이다. 하이퍼바이저는 SMMU를 설정하여 특정 장치가 할당된 VM의 메모리 영역에만 접근하도록 제한할 수 있다. 이는 악의적이거나 비정상적인 장치가 시스템 전체의 안정성을 해치는 것을 방지하는 중요한 보안 메커니즘이다.
2.3 I/O 가상화 기술 비교 분석
물리적 I/O 장치를 여러 VM이 공유하거나 특정 VM이 독점적으로 사용하도록 하는 기술은 시스템 성능과 유연성에 큰 영향을 미친다.
-
직접 장치 할당 (Direct Device Assignment / Pass-through): 이 방식은 PCI Express와 같은 물리적 I/O 장치를 하이퍼바이저의 중재 없이 특정 VM에 직접 할당한다.28 VM은 해당 장치의 네이티브 드라이버를 사용하여 하드웨어와 직접 통신하므로, 거의 네이티브에 가까운 최고 수준의 성능을 얻을 수 있다. 그러나 하나의 장치는 오직 하나의 VM만 사용할 수 있어 장치 공유가 불가능하다는 명백한 단점이 있다.29
-
반가상화 (Para-virtualization): 이 방식은 게스트 OS가 자신이 가상화 환경에서 실행 중임을 인지하고, 하이퍼바이저와 효율적으로 통신하기 위해 특수하게 설계된 ’반가상화 드라이버’를 사용하는 접근법이다.31 VirtIO는 이러한 반가상화 I/O를 위한 산업 표준 프레임워크로, 게스트 OS의 프론트엔드 드라이버와 하이퍼바이저의 백엔드 드라이버가 공유 메모리 기반의 링 버퍼(virtqueue)를 통해 효율적으로 데이터를 교환한다.31 이 방식은 장치 공유를 가능하게 하면서도 완전 가상화(full-emulation) 방식보다 훨씬 높은 성능을 제공하여, 성능과 유연성 사이의 최적의 균형을 맞추는 핵심 기술로 평가받는다.
3. NVIDIA DRIVE OS SDK 내장 하이퍼바이저 분석
NVIDIA는 DRIVE Orin 플랫폼 개발을 위해 DRIVE OS SDK를 제공하며, 이 SDK에는 배어메탈 하이퍼바이저가 포함되어 있다. 이 하이퍼바이저의 아키텍처와 정책을 이해하는 것은 Orin 플랫폼 기반의 시스템을 개발하는 데 있어 매우 중요하다.
3.1 Foundation Services 스택의 아키텍처
DRIVE OS SDK의 핵심은 부트로더, 타입 1 하이퍼바이저, 그리고 다양한 가상화 구성요소를 포함하는 ‘Foundation Services’ 스택이다.26 이 아키텍처에서 하이퍼바이저는 가장 낮은 레벨에 위치하여 하드웨어 자원을 직접 관리한다. 하이퍼바이저는 시스템을 논리적인 ’파티션’으로 분리하며, 각 파티션은 게스트 OS나 독립적인 베어메탈 애플리케이션을 호스팅할 수 있다. 하이퍼바이저의 핵심 역할은 파티션 간의 엄격한 격리를 보장하고, 각 파티션에 CPU 및 메모리 자원의 가상화된 뷰를 제공하며, 하드웨어와의 모든 상호작용을 중재하는 것이다.27
3.2 핵심 제한사항: 단일 유형 게스트 OS 정책
NVIDIA의 공식 문서와 개발자 포럼을 통해 확인된 가장 중요한 특징이자 제한사항은, SDK에 포함된 하이퍼바이저가 여러 종류의 게스트 OS를 동시에 지원하지 않는다는 점이다.27 공식 문서에는 “Multiple Guest OSs are not supported. In addition, you can run QNX or Linux, but not both.“라고 명시되어 있다.26
이는 자동차 업계에서 일반적인 혼합 중요도 사용 사례, 즉 디지털 계기판을 위해 QNX와 같은 실시간 OS(RTOS)를 실행하고 인포테인먼트를 위해 Linux나 Android를 동시에 실행하는 아키텍처를 SDK 기본 하이퍼바이저만으로는 구현할 수 없음을 의미한다. 이 정책은 단순한 기술적 한계를 넘어, NVIDIA의 전략적 포지셔닝을 보여준다. NVIDIA의 핵심 역량은 고성능 컴퓨팅 하드웨어와 AI 가속(CUDA, TensorRT)에 있으며, ISO 26262 ASIL D와 같은 최고 수준의 기능 안전 인증을 요구하는 하이퍼바이저 및 RTOS 개발은 QNX나 Green Hills와 같은 전문 파트너사의 영역이다.38 따라서 NVIDIA는 SDK 하이퍼바이저를 완전한 양산용 솔루션이 아닌, 파트너사들이 Orin 플랫폼에 자사의 솔루션을 통합하고 검증할 수 있도록 지원하는 ’기반 기술(Enabling Technology)’이자 ’참조 구현’으로 제공하는 전략을 취하고 있다. 이는 복잡한 기능 안전 인증의 책임을 파트너 에코시스템에 맡기고, 자사는 핵심 역량에 집중하면서 강력한 파트너십을 구축하는 효율적인 비즈니스 모델이다.
3.3 Para-virtualized 서버 아키텍처
단일 게스트 OS 환경 내에서 Orin SoC의 다양한 하드웨어 가속기를 효율적이고 안전하게 사용하기 위해, DRIVE OS는 여러 ‘반가상화(Para-virtualized)’ 서버 아키텍처를 채택하고 있다.26 하이퍼바이저는 이러한 서버들을 통해 물리적 하드웨어에 대한 접근을 중재한다.
-
GPU 서버: 가상화 코어 위에서 실행되며, 게스트 VM 내의 클라이언트 드라이버와 통신하여 여러 애플리케이션 간의 GPU 리소스 공유를 관리한다.
-
Security Engine (SE) 서버: SoC에 내장된 암호화 하드웨어 가속기에 대한 접근을 가상화하여 여러 VM이 안전하게 암호화 기능을 사용할 수 있도록 한다.
-
스토리지 서버: eMMC나 UFS와 같은 물리적 저장 장치를 여러 VM이 안전하게 공유할 수 있도록 스토리지 접근을 가상화한다.
-
기타 서버: 이 외에도 오디오, I2C, 디버깅 등 다양한 하드웨어 블록에 대한 접근을 중재하는 특화된 서버들이 존재하여 시스템의 안정성과 보안을 강화한다.40
4. DRIVE Orin을 위한 상용 하이퍼바이저 에코시스템 심층 비교
NVIDIA SDK의 내장 하이퍼바이저가 단일 OS 환경에 초점을 맞추고 있는 만큼, 실제 양산 차량에서 요구되는 혼합 중요도 시스템을 구축하기 위해서는 전문 상용 하이퍼바이저 솔루션을 도입하는 것이 필수적이다. DRIVE Orin 플랫폼을 지원하는 주요 상용 솔루션은 다음과 같다.
4.1 BlackBerry QNX Hypervisor for Safety
-
기술적 특징: QNX Hypervisor는 수십 년간 임베디드 시스템 시장에서 신뢰성을 검증받은 QNX Neutrino RTOS의 마이크로커널 아키텍처를 기반으로 하는 타입 1 하이퍼바이저다.41 ARMv8 및 x86-64 아키텍처의 하드웨어 가상화 확장을 완벽하게 활용하여 게스트 OS를 강력하게 격리한다.39 특히, 가상 CPU(vCPU)에 대한 우선순위 기반 스케줄링과 특정 vCPU를 물리적 CPU 코어에 고정하는 ‘피닝(pinning)’ 기능을 지원하여, 안전-필수 시스템의 실시간성과 결정론적 동작을 보장하는 데 탁월한 성능을 보인다.41
-
DRIVE Orin 지원: BlackBerry QNX는 NVIDIA의 핵심 파트너사 중 하나로, DRIVE AGX Orin 플랫폼을 위한 공식 보드 지원 패키지(Board Support Package, BSP)를 제공한다.43 이는 개발자들이 QNX 하이퍼바이저를 Orin 하드웨어에 즉시 적용하고 개발을 시작할 수 있음을 의미하며, 양사 간의 긴밀한 기술 협력을 증명한다.
-
게스트 OS 지원: 수정되지 않은(unmodified) Linux, Android와 같은 범용 OS를 게스트로 지원하여, 안전성이 요구되는 QNX 기반 파티션과 비안전 IVI 시스템을 단일 SoC에서 원활하게 통합할 수 있다.39
-
기능 안전성: QNX Hypervisor for Safety는 독일의 공인 인증기관인 TÜV Rheinland로부터 ISO 26262 ASIL D 수준의 사전 인증을 획득했다.39 이는 하이퍼바이저 자체가 최고 안전 등급의 ’문맥 독립적 안전 요소(Safety Element out of Context, SEooC)’로 인정받았음을 의미한다. 이를 통해 자동차 제조사(OEM)와 부품 공급사(Tier-1)는 하이퍼바이저 자체의 안전성을 별도로 입증할 필요 없이, 그 위에 탑재되는 애플리케이션의 안전성 인증에만 집중할 수 있어 전체 시스템의 인증 과정에 소요되는 시간과 비용을 획기적으로 절감할 수 있다.
4.2 Green Hills INTEGRITY Multivisor
-
기술적 특징: INTEGRITY Multivisor의 가장 큰 차별점은 업계 최고 수준의 보안 인증인 Common Criteria EAL 6+를 획득한 INTEGRITY RTOS의 ‘분리 커널(separation kernel)’ 아키텍처를 기반으로 한다는 점이다.44 이는 하이퍼바이저의 신뢰 컴퓨팅 기반(Trusted Computing Base, TCB)이 극도로 작고 수학적으로 검증 가능하여, 잠재적인 보안 취약점과 공격 표면을 최소화한다.46
-
DRIVE Orin 지원: Green Hills는 NVIDIA와 오랜 기간 파트너십을 유지하며 Tegra 프로세서 제품군을 지원해왔다.45 비록 DRIVE Orin에 대한 명시적인 보도자료는 부족하지만, 양사의 지속적인 협력 관계와 기술 지원 이력을 고려할 때 Orin 플랫폼 지원은 확실시된다.47
-
게스트 OS 지원: Linux, Android, Windows, 심지어 경쟁 솔루션인 QNX까지 다양한 종류의 비수정 게스트 OS를 지원하는 폭넓은 호환성을 제공한다.46
-
기능 안전성: 기반이 되는 INTEGRITY RTOS는 ISO 26262 ASIL D 인증을 획득했다.38 이를 통해 Multivisor는 안전-필수 애플리케이션과 일반 목적 OS를 수학적으로 검증된 커널 위에서 강력하게 분리하여 최고 수준의 안전성과 보안성을 동시에 제공한다.46
4.3 Wind River Helix Virtualization Platform
-
기술적 특징: Helix Virtualization Platform은 항공, 국방 등 극한의 신뢰성이 요구되는 시장에서 수십 년간 검증된 실시간 OS인 VxWorks와, Yocto Project 기반의 Wind River Linux를 단일 플랫폼에 통합한 솔루션이다.49 이는 혼합 중요도 애플리케이션을 통합하고 클라우드 네이티브 개발 방법론을 엣지 디바이스에 적용하는 데 초점을 맞추고 있다.51
-
DRIVE Orin 지원: Wind River는 DRIVE Orin과 동일한 Arm 아키텍처를 공유하는 NVIDIA Jetson Orin 플랫폼에서 Wind River Linux의 성능과 호환성을 성공적으로 검증하고 시연했다.52 이는 DRIVE Orin 플랫폼으로의 기술적 확장 가능성이 매우 높음을 시사한다.52
-
기능 안전성: Helix Platform은 항공우주(DO-178C), 산업(IEC 61508) 및 자동차(ISO 26262) 분야의 엄격한 안전 인증 요구사항을 충족하도록 설계되어, 다양한 산업 분야의 안전-필수 시스템에 적용될 수 있다.50
4.4 기타 솔루션 (SYSGO PikeOS, OpenSynergy COQOS)
-
SYSGO PikeOS: 유럽의 항공, 철도, 자동차 산업에서 강력한 입지를 가진 분리 커널 기반 RTOS 및 하이퍼바이저다. ISO 26262 인증을 지원하며, ITAR(국제 무기 거래 규정)의 적용을 받지 않는 유럽산 솔루션이라는 특징이 있다.54
-
OpenSynergy COQOS Hypervisor: 반가상화 표준인 VIRTIO를 적극적으로 채택하여 게스트 OS의 이식성과 재사용성을 극대화한 타입 1 하이퍼바이저다.57 ISO 26262 ASIL B 인증을 획득했으며, 주로 디지털 콕핏 컨트롤러에 적용된다.59 (참고: Qualcomm이 2024년 OpenSynergy의 가상화 관련 자산을 인수했다 61).
4.5 DRIVE Orin 플랫폼용 상용 하이퍼바이저 솔루션 비교 분석
| 기능 | BlackBerry QNX Hypervisor for Safety | Green Hills INTEGRITY Multivisor | Wind River Helix Platform | SYSGO PikeOS |
|---|---|---|---|---|
| 기반 기술 | 마이크로커널 RTOS | 분리 커널(Separation Kernel) | 통합 RTOS (VxWorks) / Linux | 분리 커널(Separation Kernel) |
| 최고 ISO 26262 인증 | ASIL D (TÜV 사전 인증) 39 | ASIL D (기반 RTOS 인증) 48 | ASIL D 인증 가능 50 | ASIL D 인증 가능 56 |
| DRIVE Orin 공식 지원 | 예 (BSP 제공) 43 | 강력한 파트너십 기반 45 | 유사 플랫폼(Jetson Orin) 지원 52 | BSP 문의 필요 55 |
| 주요 지원 게스트 OS | Linux, Android 39 | Linux, Android, Windows, QNX 46 | Linux, Android, Windows 50 | Linux, Android, AUTOSAR 56 |
| I/O 가상화 모델 | Pass-through, Para-virtualized (VirtIO) 39 | Pass-through, Para-virtualized | Pass-through, Para-virtualized | Pass-through, Para-virtualized |
| 핵심 차별점 | 강력한 실시간성, ASIL D 사전 인증 | 최고 수준의 보안성(EAL 6+) | VxWorks/Linux 통합, 클라우드 네이티브 | 유럽 시장 강점, ITAR-free |
5. 핵심 가속기 가상화 전략: GPU 및 AI 엔진
DRIVE Orin SoC의 진정한 가치는 강력한 GPU와 AI 가속기(DLA, PVA)에 있다. 혼합 중요도 시스템에서 이러한 고가의 공유 자원을 여러 VM이 안전하고 효율적으로 사용하기 위해서는 정교한 가속기 가상화 전략이 필수적이다.
5.1 디지털 콕핏에서의 GPU 공유 아키텍처
현대의 디지털 콕핏은 안전-필수 정보를 표시하는 디지털 계기판과 비디오 재생, 내비게이션 등을 담당하는 인포테인먼트 시스템이 하나의 SoC와 GPU 자원을 공유하는 구조가 일반적이다.4 GPU 가상화의 핵심 목표는 단순히 성능을 나누는 것을 넘어, 한 VM의 GPU 관련 오류(예: IVI 시스템의 그래픽 드라이버 충돌)가 다른 VM(예: 계기판)의 화면 출력을 방해하지 않도록 보장하는 ’안전성’에 있다.
NVIDIA는 자사의 vGPU 기술을 통해 GPU를 가상화한다.63 DRIVE OS는 여러 클라이언트 VM 간의 GPU 공유를 중재하는 반가상화된 GPU 서버를 포함한다. 이 서버는 각 게스트 OS에 설치된 반가상화 클라이언트 드라이버와 협력하여 GPU 명령을 스케줄링하고 렌더링 결과를 각 VM에 안전하게 전달한다.26 이 기술은 NVIDIA의 독점적인 지적 재산(IP)이며, 상용 하이퍼바이저 업체가 DRIVE Orin의 GPU를 가상화하기 위해서는 NVIDIA가 제공하는 이 드라이버 및 API 스택에 의존해야 한다. 이는 플랫폼에 대한 기술적 종속성을 강화하여, 자동차 제조사가 Orin 칩을 선택하면 소프트웨어 스택의 핵심 부분은 필연적으로 NVIDIA의 기술을 사용하게 되는 ‘잠금(Lock-in)’ 효과를 만들어낸다.
5.2 AI 가속기(DLA, PVA) 가상화 접근법
DRIVE Orin의 자율주행 성능은 심층학습 가속기(Deep Learning Accelerator, DLA)와 프로그래머블 비전 가속기(Programmable Vision Accelerator, PVA)와 같은 특수 목적 하드웨어에 크게 의존한다.6 이러한 AI 가속기를 가상화하는 것은 범용 GPU를 가상화하는 것보다 더 복잡한 과제다. 하이퍼바이저는 여러 VM으로부터 들어오는 AI 추론 요청을 안전하게 중재하고, 각 VM에 할당된 자원 쿼터에 따라 작업을 스케줄링하며, 결과 데이터를 정확한 VM으로 전달해야 한다.64
NVIDIA DRIVE OS는 CUDA 및 TensorRT 라이브러리를 포함하고 있으며, 이는 하드웨어 가속기에 대한 고수준 API를 제공한다.34 하이퍼바이저 환경에서 이러한 라이브러리 호출은 가상화 계층을 통해 하드웨어 접근이 안전하게 중재될 것으로 예상된다. 이는 상용 하이퍼바이저 솔루션이 Orin의 AI 성능을 완벽하게 활용하기 위해서는, NVIDIA와 긴밀하게 협력하여 해당 가속기를 위한 특화된 반가상화 드라이버와 백엔드 로직을 개발해야 함을 시사한다.
6. 결론 및 개발자를 위한 전략적 제언
NVIDIA DRIVE Orin AGX 플랫폼에서 배어메탈 하이퍼바이저를 활용하는 것은 현대적인 자동차 E/E 아키텍처를 구현하기 위한 필수적인 선택이다. 그러나 어떤 하이퍼바이저를 선택하고 어떻게 시스템을 구성할지는 프로젝트의 목표와 요구사항에 따라 달라지는 전략적 결정이다.
6.1 하이퍼바이저 선택의 전략적 분기점
-
NVIDIA 내장 하이퍼바이저: 이 솔루션은 ADAS/AD 기능 프로토타이핑과 같이 단일 OS(주로 Linux) 환경에서 Orin 플랫폼의 최대 컴퓨팅 성능과 AI 가속 기능을 탐색하고 개발하는 연구/개발 단계에 가장 적합하다. 양산에 필요한 혼합 중요도 OS 통합이나 기능 안전 인증을 직접 지원하지는 않지만, 플랫폼의 기반 기술을 이해하고 파트너 솔루션을 통합하기 위한 안정적인 기반을 제공한다.
-
상용 하이퍼바이저 (QNX, Green Hills 등): 디지털 콕핏, 도메인 컨트롤러와 같이 여러 OS(예: QNX + Linux)를 통합하고, ISO 26262 기능 안전 인증이 필수적인 양산 프로젝트에는 검증된 상용 솔루션이 반드시 필요하다. 이러한 솔루션들은 기능 안전 인증 패키지, 강력한 실시간 성능, 그리고 전문적인 기술 지원을 제공하여 양산 개발의 리스크와 기간을 단축시킨다.
6.2 기능 안전성 요구사항(ASIL) 기반의 선정 전략
프로젝트에서 요구하는 최고 ASIL(Automotive Safety Integrity Level) 등급은 하이퍼바이저 선택의 가장 중요한 기준이 되어야 한다.
-
만약 시스템이 ASIL B 이상의 기능 안전성을 요구한다면, ASIL D 사전 인증을 받은 QNX Hypervisor for Safety나 ASIL D 인증 RTOS에 기반한 Green Hills INTEGRITY Multivisor와 같은 솔루션을 우선적으로 고려해야 한다.39
-
SEooC(문맥 독립적 안전 요소)로 인증된 하이퍼바이저를 사용하는 것은 전체 시스템의 안전 사례(Safety Case)를 구축하고 인증 기관을 설득하는 데 드는 막대한 노력과 비용을 절감하는 가장 효과적인 방법이다.67
6.3 성공적인 혼합 중요도 시스템 구축을 위한 아키텍처 권고안
-
정적 파티셔닝 우선 적용: 시스템의 예측 가능성과 안정성을 극대화하기 위해, 시스템 부팅 시점에 CPU 코어, 메모리, I/O 장치를 각 VM에 고정적으로 할당하는 정적 파티셔닝 방식을 우선적으로 채택할 것을 권고한다. 동적 자원 할당은 유연성을 제공하지만, 실시간성과 안전성 분석을 복잡하게 만들 수 있다.
-
I/O 공유 최소화 및 최적화: 성능과 안전성이 중요한 센서나 액추에이터와 같은 장치는 가능한 Pass-through 방식을 사용하여 특정 VM에 독점적으로 할당하는 것이 바람직하다. GPU와 같이 공유가 불가피한 자원에 대해서는, 성능과 안전성이 검증된 반가상화(Para-virtualization) 솔루션을 사용해야 한다.
-
3자 기술 협력 체계 구축: 성공적인 양산 프로젝트를 위해서는 칩 공급사인 NVIDIA, 하이퍼바이저 공급사(예: QNX), 그리고 시스템을 통합하는 자동차 제조사 또는 Tier-1 간의 강력한 3자 기술 협력 체계 구축이 필수적이다. 특히 GPU 및 AI 가속기와 같은 독점적인 하드웨어의 가상화와 관련된 복잡한 기술적 문제를 해결하고, 최종 시스템의 안정성과 성능을 보장하기 위해서는 긴밀한 협력이 무엇보다 중요하다.
7. 참고 자료
- Automotive Hypervisor - QNX, https://blackberry.qnx.com/en/ultimate-guides/automotive-hypervisor
- Automotive Hypervisor Market Share | Industry Analysis, 2032 - Fortune Business Insights, https://www.fortunebusinessinsights.com/automotive-hypervisor-market-106411
- The Future of Software Defined Vehicles Requires Converging Enterprise and Embedded Hypervisors - Wipro, https://www.wipro.com/blogs/kishore-kanala/the-future-of-software-defined-vehicles-requires-converging-enterprise-and-embedded-hypervisors/
- In-depth analysis of automotive smart cockpit chips: the logic behind the battle for cockpit-driver integration - EEWORLD, https://en.eeworld.com.cn/news/qcdz/eic692411.html
- NVIDIA Introduces DRIVE AGX Orin — Advanced, Software-Defined Platform for Autonomous Machines, https://nvidianews.nvidia.com/news/nvidia-introduces-drive-agx-orin-advanced-software-defined-platform-for-autonomous-machines
- DRIVE AGX Autonomous Vehicle Development Platform - NVIDIA Developer, https://developer.nvidia.com/drive/agx
- The New Era of Transportation Is Built on NVIDIA DRIVE Orin, https://blogs.nvidia.com/blog/new-era-transportation-drive-orin/
- Hypervisor in Automotive - Critical Use cases - Confluence Mobile - COVESA, https://wiki.covesa.global/display/MIG/Hypervisor+in+Automotive+-+Critical+Use+cases
- The Role of Automotive Hypervisors in Vehicle Technology - KBV Research, https://www.kbvresearch.com/blog/role-of-automotive-hypervisors/
- www.sangfor.com, https://www.sangfor.com/glossary/cloud-and-infrastructure/bare-metal-hypervisor#:~:text=A%20bare%20metal%20hypervisor%2C%20also,interacting%20with%20the%20server%20hardware.
- Bare Metal Hypervisor Explained: Benefits & Best Practices - Sangfor Technologies, https://www.sangfor.com/glossary/cloud-and-infrastructure/bare-metal-hypervisor
- What is a Bare Metal Hypervisor? - VMware, https://www.vmware.com/topics/bare-metal-hypervisor
- Bare Metal Hypervisors: Benefits and Use Cases - DigitalOcean, https://www.digitalocean.com/community/conceptual-articles/what-is-bare-metal-hypervisor
- Type 1 vs Type 2 Hypervisors - Difference Between Hypervisor Types - AWS, https://aws.amazon.com/compare/the-difference-between-type-1-and-type-2-hypervisors/
- A Secret-Free Hypervisor: Rethinking Isolation in the Age of Speculative Vulnerabilities - Microsoft, https://www.microsoft.com/en-us/research/wp-content/uploads/2022/07/sf-hypervisor.pdf
- Supporting Temporal and Spatial Isolation in a Hypervisor for ARM Multicore Platforms - Xvisor, https://xhypervisor.org/pdf/isol-ICIT18.pdf
- QNX Hypervisor - Protection strategies, https://www.qnx.com/developers/docs/8.0/com.qnx.doc.hypervisor.user/topic/qhs/isolation.html
- A hypervisor approach with real-time support to the MIPS M5150 processor - prpl Foundation, https://prplfoundation.org/wp-content/uploads/2015/08/isqed2015-2.pdf
- Solutions for Functional Safety / ISO 26262 - Vector, https://www.vector.com/se/en/products/solutions/safety-security/functional-safety-iso-26262/
- Maximizing Safety and Performance with Automotive Hypervisors - Blog, https://globalriskcommunity.com/profiles/blogs/maximizing-safety-and-performance-with-automotive-hypervisors
- Exception levels - Learn the architecture - AArch64 Exception Model, https://developer.arm.com/documentation/102412/latest/Privilege-and-Exception-levels/Exception-levels
- AArch64 Exception Levels. ARMv8 architecture associates Exception… | by Om Narasimhan | Medium, https://medium.com/@om.nara/aarch64-exception-levels-60d3a74280e6
- arm - Difference between privilege level & exception level - Stack Overflow, https://stackoverflow.com/questions/35919580/difference-between-privilege-level-exception-level
- ARMv-8a Exception Levels - Pyjama Brah!, https://pyjamabrah.com/posts/arm64-day0-exception-levels/
- AArch64 Exception Levels | Welcome to the Mike’s homepage!, https://krinkinmu.github.io/2021/01/04/aarch64-exception-levels.html
- NVIDIA DRIVE OS Linux SDK Developer Guide, https://developer.nvidia.com/docs/drive/drive-os/6.0.7/public/drive-os-linux-sdk/drive_os_v5l_sdk_dev_guide.pdf
- Platform Software Stacks - NVIDIA Developer, https://developer.nvidia.com/docs/drive/drive-os/archives/6.0.4/linux/sdk/common/topics/archi/PlatformSoftwareStacks1.html
- What is the difference between virtio, emulated-IO, direct I/O, I/O passthrough, SR-IOV?, https://stackoverflow.com/questions/26581343/what-is-the-difference-between-virtio-emulated-io-direct-i-o-i-o-passthrough
- PCIe I/O virtualization - Neoverse Reference Design Platform Software - Arm, https://neoverse-reference-design.docs.arm.com/en/latest/features/virtualization/io-virtualization.html
- IO Virtualization, https://compas.cs.stonybrook.edu/~nhonarmand/courses/sp17/cse506/slides/io_virtualization.pdf
- Virtio: An I/O virtualization framework for Linux - IBM Developer, https://developer.ibm.com/articles/l-virtio/
- Direct-Virtio: A New Direct Virtualized I/O Framework for NVMe SSDs - MDPI, https://www.mdpi.com/2079-9292/10/17/2058
- NVIDIA DRIVE OS Linux SDK Developer Guide - Manuals.plus, https://manuals.plus/m/5a5c36e6906fce7ef48fc477797fa4623787e4efa29389e07d1a3406b5f4efbd
- Overview | NVIDIA Docs, https://developer.nvidia.com/docs/drive/drive-os/6.0.9/public/drive-os-linux-sdk/common/topics/intro_sdk/GettingStarted1.html
- Introduction | NVIDIA Docs, https://developer.nvidia.com/docs/drive/drive-os/6.0.6/public/drive-os-linux-installation/common/topics/installation/introduction/introduction.html
- Foundation Services Stack - NVIDIA Docs, https://docs.nvidia.com/drive/drive_os_5.1.6.1L/nvvib_docs/DRIVE_OS_Linux_SDK_Development_Guide/Architecture/archi_foundation.html
- DRIVE OS 6 multiple guest OS - DRIVE AGX Orin General - NVIDIA Developer Forums, https://forums.developer.nvidia.com/t/drive-os-6-multiple-guest-os/282312
- µ-visor Hypervisor Virtualization - Green Hills Software, https://www.ghs.com/products/u-visor.html
- QNX Hypervisor for Safety Pre-Certified Embedded Hypervisor, https://blackberry.qnx.com/en/products/safety-certified/qnx-hypervisor-for-safety
- NVIDIA DRIVE OS 5.2 Linux SDK Developer Guide : Platform Software Stacks, https://docs.nvidia.com/drive/drive-os-5.2.6.0L/drive-os/DRIVE_OS_Linux_SDK_NGC_Development_Guide/archi_virtualization.html
- QNX Hypervisor 2.0, https://blackberry.qnx.com/content/dam/qnx/products/hypervisor/hypervisorAutomotive-ProductBrief.pdf
- QNX Hypervisor 8.0 - Embedded Virtualization, https://blackberry.qnx.com/en/products/foundation-software/qnx-hypervisor
- NVIDIA - QNX, https://blackberry.qnx.com/en/partners/blackberry-qnx-partners/nvidia
- INTEGRITY Real-time Operating System - Green Hills Software, https://www.ghs.com/products/rtos/integrity.html
- Green Hills Software and NVIDIA Bring Advanced Graphics and Computer Vision to Platforms for Automotive, https://www.ghs.com/news/20150107_CES_nvidia.html
- INTEGRITY Multivisor - Green Hills Software, https://www.ghs.com/products/rtos/integrity_virtualization.html
- Automotive SoC Market to Reach USD 106.2 Billion by 2035, Driven - openPR.com, https://www.openpr.com/news/4207136/automotive-soc-market-to-reach-usd-106-2-billion-by-2035-driven
- Green Hills Software with Apex.AI Offers Production-Focused Safe and Secure Automated Drive Software Platform Solutions, https://www.ghs.com/news/20220105_CES_Integrity_Apex_OS_ASIL_D_driving.html
- Wind River Helix Virtualization Platform Overview - YouTube, https://www.youtube.com/watch?v=yHg7D5L9YW8
- Wind River Linux and VxWorks team up for new Helix Virtualization Platform, https://linuxgizmos.com/wind-river-linux-and-vxworks-team-up-for-new-helix-virtualization-platform/
- Wind River Helix Virtualization Platform: Changing the Way Cars Are Built and Driven, https://www.youtube.com/watch?v=hhBL7kGDwl0
- Wind River Linux on NVIDIA Jetson - Optimized and Secure Solutions, https://www.windriver.com/products/linux/nvidia
- Wind River Showcases New Levels of Machine Intelligence with AI-Driven Edge Applications at NVIDIA GTC, https://www.windriver.com/news/press/news-20240319
- PikeOS - SYSGO, https://www.sysgo.com/fileadmin/user_upload/data/flyers_brochures/SYSGO_PikeOS_Product_Note.pdf
- PikeOS RTOS & Hypervisor - SYSGO, https://www.sysgo.com/pikeos
- Automotive | SYSGO, https://www.sysgo.com/automotive
- The Automotive Virtual Platform - OpenSynergy, https://www.opensynergy.com/wp-content/uploads/2022/05/Datasheet_COQOS_9.5.pdf
- OpenSynergy Collaborates with Google and Qualcomm on Virtualizing Android Automotive OS, https://www.opensynergy.com/wp-content/uploads/2022/09/OpenSynergy_07072020_English.pdf
- DataSheet COQOS Hypervisor | OpenSynergy, https://www.opensynergy.com/wp-content/uploads/2022/05/Datasheet_COQOS_Hypervisor.pdf
- Renesas and OpenSynergy Adopted by Parrot Faurecia Automotive’s Safe Multi-Display Cockpit, https://www.renesas.com/en/about/press-room/renesas-and-opensynergy-adopted-parrot-faurecia-automotive-s-safe-multi-display-cockpit
- Qualcomm Acquires OpenSynergy’s Virtualization Assets - OpenSynergy | Bluetooth and Radio Tuner SDK for Embedded Systems, https://www.opensynergy.com/qualcomm-acquires-opensynergys-virtualization-assets/
- Driving the Future: GPU Virtualisation in Automotive - Imagination Technologies, https://www.imaginationtech.com/what-is-gpu-virtualisation/driving-the-future-gpu-virtualisation-in-automotive/
- AI & Accelerated Computing Solutions for Automotive Industries - NVIDIA, https://www.nvidia.com/en-us/industries/automotive/
- Virtualization Emerges as a Requirement for Embedded AI in Automotive SoCs - Synopsys, https://www.synopsys.com/articles/npx-virtualization.html
- NVIDIA DriveOS SDK, https://developer.nvidia.com/drive/os
- What is ISO 26262 Functional Safety Standard? - Synopsys, https://www.synopsys.com/glossary/what-is-iso-26262.html
- Functional safety and continuous certification on Linux - Red Hat, https://www.redhat.com/en/topics/open-source/functional-safety-and-continuous-certification-on-linux
- VOSySmonitor - ISO 26262 ASIL C certification - Virtual Open Systems, https://www.virtualopensystems.com/en/company/vosysmonitor-iso26262-asilc/