32.3 Reliability 폴리시의 BEST_EFFORT 및 RELIABLE 모드 신뢰율 모델링
자율 에이전트 드론이 작동하는 실외 및 창고형 환경의 무선(Wi-Fi, LTE 등) 네트워크는 대역폭 변동과 파장 간섭 빈도가 매우 높은 손실성(Lossy) 매체이다. 기반 프로토콜인 UDP(User Datagram Protocol)를 차용하는 DDS 미들웨어 계층은, 태생적으로 목적지 도달을 확약하지 않는 UDP의 빈틈을 메우기 위해 RTPS(Real-Time Publish Subscribe) 레벨에서 논리적인 수신 확인 및 재전송 알고리즘을 래핑(Wrapping)한다. 그러나 이 안전망은 공짜가 아니며 필연적으로 레이턴시(Latency)를 담보로 요구한다. 본 절에서는 QoS의 Reliability(신뢰도) 폴리시를 지배하는 두 가지 핵심 모드인 BEST_EFFORT와 RELIABLE 전략을 대조하고, 각 모드가 네트워크 대역폭과 자율 제어 스케줄러에 미치는 공학적 비용을 모델링한다.
1. BEST_EFFORT 폴리시: 극단적 적시성(Timeliness)을 향한 파이어-앤-포겟(Fire-and-Forget)
BEST_EFFORT 모드는 이름 그대로 미들웨어가 ‘최선을 다해 전송하되, 실패 시 아무런 책임도 지지 않는’ Fire-and-Forget 전송 철학을 명세한다.
송신자(Publisher)는 패킷을 네트워크 버퍼에 밀어 넣은 직후 즉시 다음 연산으로 넘어가며, 수신자(Subscriber)로부터의 응답(ACK)을 기다리거나 유실된 시퀀스 번호를 트래킹하여 재전송(Retransmission)하는 어떠한 로직도 가동하지 않는다. 이는 통신망에 프로토콜 오버헤드를 제로(0) 수준으로 억제하며 지터(Jitter: 지연 시간의 변동성)를 획기적으로 낮추는 결과를 낳는다. 1000Hz로 샘플링되는 관성 측정 장치(IMU)나 60fps로 쏟아지는 이미지 프레임 스트림의 경우, 중간에 몇 패킷이 공중에서 분해되더라도 수십 밀리초 뒤에 전파될 최신(Latest) 프레임이 훨씬 더 중요하므로, 정보의 유통 기한이 극도로 짧은 연속 센서 페이로드 환경에서 BEST_EFFORT는 유일무이한 합리적 선택지이다.
2. RELIABLE 폴리시: 무결성(Integrity) 보장과 지연 파도(Ripple Effect)의 역학
반대 척도에 위치한 RELIABLE 모드는 발송된 모든 데이터가 수신 측에 ‘순서대로, 단 한 바이트의 손실도 없이’ 도달할 것임을 RTPS 프로토콜 레벨에서 엄격히 보장한다.
이를 위해 미들웨어는 수신 확인(ACK/NACK) 트리거, 손실 감지 시 History 버퍼를 검색하여 재전송을 수행하는 복구 스레드, 그리고 도착 순서가 뒤바뀐 패킷을 재정렬하는 재조합(Re-ordering) 버퍼를 전면 가동한다. 이는 무선 통신 환경에서 TCP 소켓과 유사한 절대적 신뢰성을 확보하지만, 반대급부로 치명적인 지연 파도(Delay Ripple Effect)를 양산한다. 한 번의 전파 방해로 특정 패킷 전송이 지연되면 큐(Queue) 내부의 후속 패킷들은 선행 패킷이 물리적으로 도달하여 ACK를 받을 때까지 모두 대기열에 묶이게 된다(Head-of-Line Blocking 반입). 따라서 RELIABLE 정책은 드론의 전원 인가(Arming), 임무 궤적(Waypoint) 배열 하달, 파라미터 세팅 등 초당 전송량이 적으나 절대 유실되어서는 안 되는 제어 인스트럭션 관제 채널에만 한정적으로 채택되어야 한다.
3. 비대칭 Reliability 모델링과 호환성 계약(Compatibility Contract) 위반
효율적인 컴포넌트 통합을 위해 ROS2는 퍼블리셔와 서브스크라이버 간에 각기 다른 QoS 폴리시 생태계를 허용하지만, Reliability 정책만큼은 엄격한 호환성 계약(Request-Offer) 체계에 종속된다.
논리적 포괄성 원칙에 따라, 송신 측이 재전송을 감내하는 RELIABLE 퍼블리셔로 동작할 때, 수신 측이 패킷 손실을 개의치 않는 BEST_EFFORT 서브스크라이버로 등록하는 것은 구조적으로 허용(Match)된다. 송신자가 더 질 높은 서비스를 제공하고 있기 때문이다. 반면, 송신 측이 BEST_EFFORT 스탠스를 취하고 있음에도 수신 측이 RELIABLE 등급을 요구한다면, 퍼블리셔는 태생적으로 수신자의 재전송 요구(NACK)를 충족시킬 능력이 전무하므로 미들웨어 레벨에서 이 두 노드의 연결을 아예 차단해 버린다. 이는 이른바 IncompatibleQoS 이벤트를 발생시키며, 설계자가 시스템 통합 단계에서 통신 품질의 파편화를 선제적으로 색출하게 하는 ROS2 통신망 감리의 핵심 기둥이다.