5.7 비용 함수(Cost Function) 설계

1. 정의

비용 함수(Cost Function)는 궤적의 품질을 정량적으로 평가하는 함수로, 동작 계획에서 다수의 후보 궤적 중 최적의 궤적을 선택하기 위한 기준을 제공한다. 비용 함수는 안전성, 효율성, 쾌적성, 법규 준수 등 다수의 목표를 하나의 스칼라 값으로 통합하는 역할을 수행한다.

2. 비용 함수의 일반적 구조

비용 함수는 일반적으로 다수의 개별 비용 항(Cost Term)의 가중 합(Weighted Sum)으로 구성된다.

$J(\boldsymbol{\tau}) = \sum_{i=1}^{N} w_i \cdot C_i(\boldsymbol{\tau})$

여기서 $C_i(\boldsymbol{\tau})$ 는 $i$ 번째 비용 항, $w_i$ 는 해당 비용 항의 가중치이다. 가중치의 상대적 크기가 각 비용 항의 우선순위를 결정하며, 가중치의 조정(Tuning)이 비용 함수 설계의 핵심 과제 중 하나이다.

3. 주요 비용 항

3.1 안전 비용 (Safety Cost)

장애물과의 충돌 위험을 반영하는 비용이다. 객체와의 거리에 반비례하여 비용이 증가하며, 안전 거리 이내로 접근할수록 비용이 급격히 상승하도록 설계된다.

$C_{\text{safety}}(\boldsymbol{\tau}) = \sum_{t} \sum_{k} \phi(d(\boldsymbol{\tau}(t), \mathbf{o}_k(t)))$

여기서 $d(\boldsymbol{\tau}(t), \mathbf{o}_k(t))$ 는 시점 $t$ 에서 궤적과 $k$ 번째 객체 사이의 거리이며, $\phi(\cdot)$ 는 거리에 따른 비용 함수(예: 역수 장벽 함수, 가우시안 함수)이다.

3.2 경로 추종 비용 (Path Following Cost)

목표 경로(차선 중앙선 등)와의 횡방향 편차를 반영하는 비용이다.

$C_{\text{path}}(\boldsymbol{\tau}) = \sum_{t} (d_{\text{lat}}(t))^2$

여기서 $d_{\text{lat}}(t)$ 는 시점 $t$ 에서 궤적과 목표 경로 사이의 횡방향 거리이다.

3.3 속도 비용 (Velocity Cost)

목표 속도와의 편차를 반영하는 비용이다. 목표 속도는 도로의 속도 제한, 전방 차량의 속도, 교통 상황 등에 따라 결정된다.

$C_{\text{vel}}(\boldsymbol{\tau}) = \sum_{t} (v(t) - v_{\text{ref}})^2$

3.4 쾌적성 비용 (Comfort Cost)

탑승자의 쾌적성을 반영하는 비용으로, 가속도와 가가속도(Jerk)의 크기를 최소화한다.

$C_{\text{comfort}}(\boldsymbol{\tau}) = \sum_{t} \left[ w_a \cdot a(t)^2 + w_j \cdot j(t)^2 + w_{\kappa} \cdot \dot{\kappa}(t)^2 \right]$

여기서 $a(t)$ 는 종방향 가속도, $j(t)$ 는 종방향 가가속도, $\dot{\kappa}(t)$ 는 곡률 변화율이다.

3.5 진행 비용 (Progress Cost)

목적지를 향한 진행도를 반영하는 비용이다. 진행 비용이 없으면 차량이 정지하거나 불필요하게 느리게 주행하는 것이 최소 비용 해가 될 수 있다.

$C_{\text{progress}}(\boldsymbol{\tau}) = -\Delta s$

여기서 $\Delta s$ 는 궤적을 따라 이동한 종방향 거리이다. 음의 비용으로 설정하여 진행을 장려한다.

4. 비용 함수 설계의 과제

4.1 가중치 조정 (Weight Tuning)

비용 항의 가중치는 시스템의 주행 특성을 결정하는 핵심 매개변수이다. 가중치 조정은 전통적으로 전문가의 수동 조정에 의존하였으나, 최근에는 역강화 학습(Inverse Reinforcement Learning, IRL)을 통해 인간 운전자의 시연 데이터로부터 비용 함수의 가중치를 자동으로 학습하는 방법이 연구되고 있다(Abbeel & Ng, 2004).

4.2 다목적 최적화의 상충

안전, 효율, 쾌적성은 서로 상충하는 목표이다. 안전을 극대화하면 과도하게 보수적인 주행이 되고, 효율을 극대화하면 안전 마진이 감소한다. 비용 함수는 이러한 상충 관계를 적절히 균형 맞추어야 한다.

4.3 상황 의존적 비용

동일한 비용 함수가 모든 주행 상황에 적합하지 않을 수 있다. 고속도로, 도심, 주차장 등 상황에 따라 비용 항의 가중치를 동적으로 조정하는 적응적 비용 함수 설계가 필요하다.

5. 참고 문헌

Abbeel, P., & Ng, A. Y. (2004). Apprenticeship learning via inverse reinforcement learning. Proceedings of the 21st International Conference on Machine Learning (ICML), 1–8.
Werling, M., Ziegler, J., Kammel, S., & Thrun, S. (2010). Optimal trajectory generation for dynamic street scenarios in a Frenet frame. Proceedings of the IEEE International Conference on Robotics and Automation (ICRA), 987–993.

v1.0