2.15 하드웨어 가속기 기반 ROS2 컴퓨팅 오프로딩(Offloading) 구조

2.15 하드웨어 가속기 기반 ROS2 컴퓨팅 오프로딩(Offloading) 구조

최신 자율 에이전트 드론 시스템은 4K 수준의 고해상도 스테레오 비전 센서부터 초당 수십만 개의 3차원 점군(Point Cloud)을 생성하는 LiDAR 기반 SLAM 연산, 나아가 군집 오케스트레이션을 위한 딥러닝 추론까지 극도로 방대한 알고리즘을 소형 온보드 컴퓨터(On-board Computer) 내에서 실시간으로 처리해야 한다. 전통적인 중앙 처리 장치(CPU) 중심의 연산 아키텍처는 이를 감당할 수 없으므로, 로봇 운영체제(Robot Operating System 2, ROS 2) 프레임워크는 병렬 연산에 특화된 하드웨어 가속기로 병목 블록을 이관하는 컴퓨팅 오프로딩(Offloading) 구조를 시스템 아키텍처 내에 이식하였다.

1. 이기종 시스템(Heterogeneous System) 기반 오프로딩의 학술적 원리

컴퓨팅 오프로딩이란 주 제어 프로세서(Host CPU)가 연산 집약적인(Compute-intensive) 특정 스레드 로직을 GPU(Graphics Processing Unit), FPGA(Field Programmable Gate Array), 또는 NPU(Neural Processing Unit)와 같은 보조 프로세싱 소자에 이관(Offload)하여 전체 시스템의 가동성을 최적화하는 아키텍처적 기법을 일컫는다. 다중 로봇 시스템 관점에서 오프로딩은 에이전트 내부의 마이크로 수준(내부 하드웨어 가속기)에서 일어날 수도 있고, 컴퓨팅 능력이 부족한 엣지 드론이 기지국의 고성능 클러스터로 연산을 이관하는 매크로 수준(엣지 클라우드 가속)으로도 응용된다. ROS 2는 통신 미들웨어 기반 객체 지향 설계를 띠므로, 각 인공신경망 추론 노드(Node) 자체가 가속기에 종속적으로 포팅될 수 있는 훌륭한 모듈화 단위로 작용한다.

2. ROS 2 하드웨어 가속 워킹그룹(HAWG) 분산 아키텍처

ROS 2 생태계의 하드웨어 가속 워킹그룹(Hardware Acceleration Working Group, HAWG)은 실리콘 벤더(Vendor)에 종속되지 않는 범용 오프로딩 아키텍처의 표준안을 제공한다. 기존 ROS 1 체제 하에서는 사용자 개발 코드가 GPU 등 디바이스 드라이버 메모리(VRAM)로 커스텀 래핑(Wrapping) 코드를 구축해 접근해야 했다면, HAWG가 제시하는 펌웨어 및 운영체제 확장 계층은 엑시큐터 단에서 하드웨어 커널(Hardware Kernel) 실행과 노드 생명주기를 매끄럽게 동기화하는 인터페이스 모델을 제공하여 병렬 처리 파이프라인의 구축을 간소화한다.

3. 제로 카피(Zero-copy) 데이터 전송 메커니즘을 통한 병목 소거

가속기를 탑재한 시스템 아키텍처에서 가장 두드러지는 오버헤드는 CPU의 메인 메모리(Host RAM)와 가속기의 디바이스 메모리 간의 I/O 전송 병목 현상이다. ROS 2 아키텍처는 공유 메모리(Shared Memory) 통신 플러그인과 DDS의 하드웨어 특화 기능을 융합한 제로 카피(Zero-copy) 메커니즘을 적용한다. 이 구조에서는 고용량 이미지 센서 드라이버 모듈이 생성한 데이터 프레임이 운영체제의 유저/커널 공간을 횡단하는 복사(Copy) 과정을 거치지 않고, 가속기 메모리의 특정 포인터 주소를 직접 참조함으로써 전송 지연 시간(Latency)을 마이크로초 단위로 단축시키고 비행 드론 제어계의 결정론(Determinism)을 수호한다.

4. SoC(System on Chip) 환경 기반 알고리즘-하드웨어 분배 전략

NVIDIA Jetson 제품군이나 Xilinx Kria와 같이 CPU와 가속기 소자가 단일 기판에 집적된 임베디드 SoC 환경은 현대 드론 인프라의 표준이 되고 있다. 이를 극대화하기 위해 시스템 통합 관점에서 CPU는 ROS 2 미들웨어의 QoS 통제, 디스커버리 핸들링, 그리고 모터 구동 펌웨어와의 직렬 제어 루프를 전담하도록 고정(Pinning)되고, 내장 GPU나 FPGA(프로그래머블 로직)는 VIO(Visual-Inertial Odometry), 3D 재구성(Reconstruction), 그리고 로컬 장애물 회피 알고리즘을 전담하는 비대칭 연산 분산 체계를 도입하여 다중 에이전트 자율성 보장의 학술적, 공학적 타당성을 달성한다.

  • 참고문헌 및 버전 정보
  • ROS 2 Hardware Acceleration Working Group (HAWG) documentation, Open Robotics (2022~Rolling/Jazzy 기준).
  • Acceleration Mechanisms in Service-Oriented Robotic Architectures.