1291.47 행동 트리의 반응성 원칙

1. 반응성의 정의

반응성(reactivity)이란, 시스템이 환경의 상태 변화에 대하여 시의적절하게(timely) 행동을 전환하는 능력을 의미한다. 자율 로봇 시스템에서 반응성은 안전성과 임무 수행 능력의 근본적 전제 조건이다. 로봇이 동적 환경에서 동작할 때, 장애물의 출현, 배터리 전압의 저하, 통신 링크의 단절, 사용자 명령의 변경 등 예측 불가능한 사건이 수시로 발생하며, 이에 대한 즉각적 대응이 요구된다.

행동 트리(Behavior Tree, BT)의 반응성 원칙이란, 행동 트리가 구조적 메커니즘에 의하여 환경 변화에 대한 신속한 행동 전환을 명시적 전이 규칙의 정의 없이 실현하는 설계 속성을 의미한다.

2. 반응성의 구조적 메커니즘

2.1 Tick 기반 주기적 재평가

행동 트리에서 반응성을 실현하는 가장 근본적인 메커니즘은 **Tick 기반 주기적 재평가(periodic re-evaluation)**이다. 매 Tick마다 루트 노드부터 트리를 재순회하므로, 환경 조건의 변화가 다음 Tick에서 즉시 감지된다.

Tick 주기를 $\Delta t$ 라 할 때, 환경 변화로부터 행동 트리의 반응까지의 최대 지연 시간(maximum response latency) $\tau_{\text{max}}$ 는 다음과 같이 상한이 제한된다.

$\tau_{\text{max}} \leq \Delta t + t_{\text{tick}}$

여기서 $t_{\text{tick}}$ 은 단일 Tick 순회에 소요되는 시간이다. 환경 변화가 Tick 직후에 발생하는 최악의 경우에도, 다음 Tick에서 해당 변화가 감지되므로, 반응 지연은 하나의 Tick 주기를 초과하지 않는다. 이 상한은 실시간 시스템의 최악 반응 시간(Worst-Case Response Time, WCRT) 분석에 직접 활용된다.

2.2 조건 노드에 의한 환경 감시

행동 트리에서 환경의 상태를 감시하는 역할은 **조건 노드(condition node)**가 수행한다. 조건 노드는 환경의 특정 속성을 평가하여 Success 또는 Failure를 즉시 반환하며, Running 상태를 생성하지 않는 동기적(synchronous) 노드이다.

조건 노드가 제어 흐름 노드의 자식으로 배치되면, 매 Tick마다 해당 조건이 재평가되어 환경 변화에 따른 제어 흐름의 전환이 발생한다. 예를 들어, Fallback 노드의 첫 번째 자식으로 “장애물 감지” 조건을 배치하면, 장애물이 감지될 때 회피 행동이 활성화되고, 장애물이 사라지면 원래의 행동으로 복귀한다.

ReactiveFallback
├── Sequence
│   ├── Condition: IsObstacleDetected
│   └── Action: AvoidObstacle
└── Action: FollowPath

이 구조에서 매 Tick마다 IsObstacleDetected 조건이 재평가되며, 조건의 참/거짓 전환에 따라 AvoidObstacle과 FollowPath 사이의 행동 전환이 자동으로 이루어진다.

2.3 반응형 제어 흐름 노드

행동 트리의 반응성은 **반응형 제어 흐름 노드(reactive control flow node)**에 의하여 강화된다. BehaviorTree.CPP에서 제공하는 ReactiveSequence와 ReactiveFallback은 일반 Sequence 및 Fallback과 다른 순회 규칙을 적용한다.

일반 Sequence와 ReactiveSequence의 차이:

일반 Sequence 노드에서, 자식 $c_i$ 가 Running을 반환하면 다음 Tick에서 $c_i$ 부터 순회를 재개하며 $c_1, \ldots, c_{i-1}$ 을 재평가하지 않는다. 반면, ReactiveSequence 노드에서는 Running 상태의 자식이 존재하더라도 매 Tick마다 $c_1$ 부터 모든 자식을 처음부터 재평가한다.

노드 유형	Running 상태 시 재순회 시작점	반응성 수준
Sequence	Running 상태의 자식 $c_i$ 부터	제한적
ReactiveSequence	항상 첫 번째 자식 $c_1$ 부터	완전 반응형
Fallback	Running 상태의 자식 $c_i$ 부터	제한적
ReactiveFallback	항상 첫 번째 자식 $c_1$ 부터	완전 반응형

ReactiveSequence의 동작을 형식적으로 표현하면 다음과 같다. ReactiveSequence $RS$ 가 자식 $\{c_1, c_2, \ldots, c_n\}$ 을 가질 때:

$\text{tick}(RS) = \begin{cases} \text{Failure} & \exists\, i : \text{tick}(c_i) = \text{Failure} \\ \text{Running} & \exists\, i : \text{tick}(c_i) = \text{Running} \wedge \forall\, j < i : \text{tick}(c_j) = \text{Success} \\ \text{Success} & \forall\, i : \text{tick}(c_i) = \text{Success} \end{cases}$

핵심적 차이는, 이전 Tick에서 $c_i$ 가 Running을 반환하였더라도 현재 Tick에서 $c_1$ 부터 재평가한다는 점이다. 이에 의하여, $c_1$ 의 조건이 Failure로 변경되면 $c_i$ 의 실행이 중단(halt)되고, ReactiveSequence 전체가 Failure를 반환한다.

3. 반응성의 실제 적용 패턴

3.1 안전 조건의 지속적 감시

로봇 시스템에서 가장 빈번하게 활용되는 반응성 패턴은 안전 조건의 지속적 감시이다. ReactiveSequence의 첫 번째 자식으로 안전 조건을 배치하면, 안전 조건이 위반되는 순간 현재 실행 중인 모든 행동이 즉시 중단된다.

ReactiveSequence
├── Condition: IsBatteryAbove(threshold=0.1)
├── Condition: IsEmergencyStopInactive
└── SubTree: MainMission

이 구조에서 배터리 잔량이 임계값 이하로 감소하거나, 비상 정지 명령이 활성화되면, MainMission 서브트리의 실행이 즉시 halt되고, ReactiveSequence가 Failure를 반환한다. 이 반응은 별도의 전이 규칙 정의 없이 구조적으로 보장된다.

3.2 우선순위 기반 행동 전환

ReactiveFallback을 활용하면 **우선순위 기반 행동 전환(priority-based behavior switching)**을 구현할 수 있다. 좌측에 배치된 자식일수록 높은 우선순위를 가지며, 매 Tick마다 최우선 조건부터 재평가된다.

ReactiveFallback
├── Sequence
│   ├── Condition: IsEmergencyDetected
│   └── Action: EmergencyStop
├── Sequence
│   ├── Condition: IsBatteryLow
│   └── Action: ReturnToChargingStation
└── Action: ExecutePatrolMission

이 구조에서:

비상 상황이 감지되면 즉시 비상 정지가 실행된다.
비상 상황이 아니고 배터리가 부족하면 충전소로 복귀한다.
이상이 없으면 순찰 임무를 수행한다.

매 Tick마다 최상위 조건부터 재평가되므로, 순찰 임무 수행 중에 비상 상황이 발생하면 단일 Tick 주기 이내에 비상 정지 행동으로 전환된다.

4. 상태 머신 대비 반응성의 구조적 우위

유한 상태 머신에서 반응성을 구현하려면, 현재 상태에서 환경 변화에 대응하는 전이 규칙이 명시적으로 정의되어 있어야 한다. $n$ 개의 상태와 $m$ 개의 환경 조건이 존재할 때, 완전한 반응성을 보장하기 위하여 필요한 전이 규칙의 수는 최대 $O(n \times m)$ 에 달한다.

반면, 행동 트리에서는 ReactiveSequence 또는 ReactiveFallback의 자식으로 조건 노드를 배치하는 것만으로 해당 조건에 대한 완전한 반응성이 보장된다. 조건 노드 하나의 추가만으로 트리 전체의 반응 경로가 자동으로 구성되므로, 반응성 관련 설계 비용이 $O(1)$ 로 축소된다.

특성	유한 상태 머신	행동 트리 (반응형 노드)
반응 규칙 추가 비용	$O(n)$ (모든 상태에 전이 추가)	$O(1)$ (조건 노드 하나 추가)
반응 누락 위험	전이 규칙 미정의 시 무반응	구조적으로 보장
반응 우선순위 관리	전이 우선순위를 수동 지정	노드 배치 순서로 자동 결정
반응 동작 검증	모든 상태-전이 조합 검사 필요	트리 경로 분석으로 검증 가능

5. 반응성과 Halt 메커니즘의 관계

반응형 노드에서 조건의 변화에 따라 행동이 전환될 때, 이전에 Running 상태이던 노드에는 halt 명령이 인가된다. halt는 해당 노드와 그 하위의 모든 노드를 IDLE 상태로 복귀시키며, 진행 중이던 비동기 작업의 정리(cleanup)를 수행한다.

halt 메커니즘은 반응성의 올바른 구현에 필수적이다. halt가 없다면, 행동 전환 시 이전 행동이 배경에서 계속 실행되어 자원 누수(resource leak)나 행동 간 충돌이 발생할 수 있다. BehaviorTree.CPP에서는 onHalted() 콜백을 통하여 개발자가 halt 시의 정리 논리를 정의할 수 있다.

예를 들어, 로봇이 이동 행동을 수행하던 중 비상 정지 조건이 활성화되면:

ReactiveSequence가 비상 정지 조건의 Failure를 감지한다.
Running 상태이던 이동 액션 노드에 halt가 인가된다.
onHalted() 콜백에서 속도 명령을 영벡터(zero vector)로 갱신하여 로봇을 정지시킨다.
상위 트리가 Failure를 수신하고, 비상 처리 분기로 제어 흐름이 전환된다.

6. 반응성의 대가와 설계 고려 사항

6.1 행동의 빈번한 중단과 재시작

반응형 노드에서 조건이 빈번하게 변동하면, Running 상태의 행동이 반복적으로 중단(halt)되고 재시작(restart)되는 채터링(chattering) 현상이 발생할 수 있다. 이는 센서 잡음에 의하여 조건의 참/거짓이 수시로 뒤바뀌는 경우에 특히 문제가 된다.

채터링을 방지하기 위한 일반적 방법은 다음과 같다.

히스테리시스(hysteresis): 조건의 활성화 임계값과 비활성화 임계값에 차이를 두어 빈번한 전환을 억제한다.
시간 필터링: 조건이 일정 시간 이상 지속될 때에만 반응하도록 디바운스(debounce) 논리를 적용한다.
데코레이터 노드 활용: Delay 또는 Throttle 데코레이터를 통하여 조건 재평가의 빈도를 제한한다.

6.2 반응형 노드와 메모리 노드의 선택

행동 트리 설계 시, 동일한 제어 흐름에 대하여 반응형 노드(ReactiveSequence)와 메모리 노드(SequenceWithMemory)를 선택하여야 하는 경우가 있다.

반응형 노드: 환경 변화에 즉각 반응하여야 하는 안전 임계 행동에 적합하다.
메모리 노드: 일단 진행된 단계를 재평가할 필요가 없는 순차적 임무에 적합하다.

이 선택은 로봇의 임무 특성과 안전 요구 수준에 따라 결정되어야 하며, 반응성과 임무 진행의 안정성 사이의 균형(trade-off)을 반영한다.

7. 참고 문헌

Colledanchise, M., & Ögren, P. (2018). Behavior Trees in Robotics and AI: An Introduction. CRC Press.
Colledanchise, M., & Ögren, P. (2017). “How Behavior Trees Modularize Hybrid Control Systems and Generalize Sequential Behavior Compositions, the Subsumption Architecture, and Decision Trees.” IEEE Transactions on Robotics, 33(2), 372–389.
Faconti, D. (2022). BehaviorTree.CPP 4.x Documentation. https://www.behaviortree.dev/
Iovino, M., Scukins, E., Styrud, J., Ögren, P., & Smith, C. (2022). “A Survey of Behavior Trees in Robotics and AI.” Robotics and Autonomous Systems, 154, 104096.
Macenski, S., Martín, F., White, R., & Clavero, J. G. (2020). “The Marathon 2: A Navigation System.” Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2718–2725.
Marzinotto, A., Colledanchise, M., Smith, C., & Ögren, P. (2014). “Towards a Unified Behavior Trees Framework for Robot Control.” Proceedings of the IEEE International Conference on Robotics and Automation (ICRA), 5420–5427.

버전: 2026-03-31