396.34 다목적(Multi-Objective) 임무 평가 체계

1. 서론

로봇 임무는 본질적으로 다목적(multi-objective) 구조를 가진다. 임무 소요 시간의 최소화, 에너지 소비의 절감, 탐색 범위의 극대화, 안전성의 확보, 임무 품질의 향상 등 복수의 목적 함수가 동시에 존재하며, 이들 사이에는 일반적으로 상충 관계(trade-off)가 존재한다. 단일 목적 함수로의 스칼라화(scalarization)가 항상 적절하지 않은 경우, 다목적 최적화(Multi-Objective Optimization, MOO) 프레임워크에 기반한 임무 평가 체계가 필요하다.

본 절에서는 다목적 임무 평가의 수학적 기초, 파레토 최적성(Pareto optimality)의 개념, 다목적 최적화 해법, 의사 결정 지원 기법, 그리고 로봇 임무 관리에의 적용을 체계적으로 기술한다.

2. 다목적 최적화의 수학적 정의

2.1 문제 정식화

$K$ 개의 목적 함수를 동시에 최적화하는 다목적 최적화 문제(Multi-Objective Optimization Problem, MOOP)는 다음과 같이 정식화된다:

$\min_{\mathbf{x} \in \mathcal{X}} \; \mathbf{f}(\mathbf{x}) = \bigl[f_1(\mathbf{x}), f_2(\mathbf{x}), \ldots, f_K(\mathbf{x})\bigr]^{\top}$

$\text{s.t.} \quad g_i(\mathbf{x}) \leq 0, \; i = 1, \ldots, m$

$h_j(\mathbf{x}) = 0, \; j = 1, \ldots, p$

여기서 $\mathbf{x} \in \mathcal{X} \subseteq \mathbb{R}^n$ 은 결정 변수 벡터, $\mathbf{f}: \mathbb{R}^n \rightarrow \mathbb{R}^K$ 는 목적 함수 벡터, $g_i$ 와 $h_j$ 는 부등식 및 등식 제약 함수이다.

로봇 임무 관리에서 전형적인 목적 함수의 예시는 다음과 같다:

목적 함수	물리적 의미	최적화 방향
$f_1(\mathbf{x}) = C_{\max}$	임무 총 소요 시간(makespan)	최소화
$f_2(\mathbf{x}) = \sum_i E_i$	총 에너지 소비량	최소화
$f_3(\mathbf{x}) = 1 - \text{coverage}$	미탐색 면적 비율	최소화
$f_4(\mathbf{x}) = \max_t P_{\text{coll}}(t)$	최대 충돌 확률	최소화
$f_5(\mathbf{x}) = -\text{quality}$	임무 품질(부호 반전)	최소화

2.2 파레토 최적성(Pareto Optimality)

목적 함수 간의 상충 관계로 인하여, 모든 목적 함수를 동시에 최적화하는 단일 해는 일반적으로 존재하지 않는다. 이를 위하여 파레토 최적성의 개념이 도입된다.

파레토 지배(Pareto dominance): 해 $\mathbf{x}^{(1)}$ 이 해 $\mathbf{x}^{(2)}$ 를 파레토 지배한다( $\mathbf{x}^{(1)} \prec \mathbf{x}^{(2)}$ )는 다음의 조건을 만족함을 의미한다:

$\forall k \in \{1, \ldots, K\}: \; f_k(\mathbf{x}^{(1)}) \leq f_k(\mathbf{x}^{(2)}) \quad \wedge \quad \exists k: \; f_k(\mathbf{x}^{(1)}) < f_k(\mathbf{x}^{(2)})$

즉, 모든 목적 함수에서 적어도 동등하고, 하나 이상의 목적 함수에서 엄격히 우수하다.

파레토 최적해(Pareto optimal solution): 실현 가능 영역 내에서 다른 어떤 해에도 파레토 지배되지 않는 해를 파레토 최적해(또는 비지배 해, non-dominated solution)라 한다:

$\mathbf{x}^* \in \mathcal{P} \iff \nexists \; \mathbf{x} \in \mathcal{X}_{\text{feasible}}: \; \mathbf{x} \prec \mathbf{x}^*$

파레토 프론티어(Pareto frontier): 모든 파레토 최적해의 목적 함수 값이 형성하는 목적 공간(objective space) 상의 곡면이다:

$\mathcal{F} = \left\{ \mathbf{f}(\mathbf{x}^*) \;\middle|\; \mathbf{x}^* \in \mathcal{P} \right\}$

파레토 프론티어는 달성 가능한 목적 함수 간의 최적 트레이드오프 관계를 시각화한다.

3. 다목적 최적화 해법

3.1 스칼라화 기법

다목적 문제를 단일 목적 문제로 변환하는 기법이다.

가중합(Weighted Sum) 방법: 목적 함수의 가중 합을 최소화한다:

$\min_{\mathbf{x}} \sum_{k=1}^{K} w_k f_k(\mathbf{x}), \quad w_k > 0, \; \sum_k w_k = 1$

가중치 벡터 $\mathbf{w}$ 를 변화시키면 파레토 프론티어 상의 상이한 점을 얻을 수 있다. 단, 비볼록(non-convex) 파레토 프론티어의 경우 일부 파레토 최적해를 발견하지 못하는 한계가 있다.

$\epsilon$ -제약( $\epsilon$ -Constraint) 방법: 하나의 목적 함수만 최적화하고, 나머지 목적 함수는 제약으로 처리한다:

$\min_{\mathbf{x}} f_1(\mathbf{x}) \quad \text{s.t.} \quad f_k(\mathbf{x}) \leq \epsilon_k, \; k = 2, \ldots, K$

$\epsilon_k$ 값을 체계적으로 변화시켜 파레토 프론티어를 근사한다. 비볼록 프론티어도 탐색할 수 있는 장점이 있다.

체비셰프(Tchebycheff/Chebyshev) 방법: 이상 점(ideal point) $\mathbf{z}^* = [z_1^*, \ldots, z_K^*]^{\top}$ 으로부터의 가중 체비셰프 거리를 최소화한다:

$\min_{\mathbf{x}} \max_{k} \left\{ w_k \left| f_k(\mathbf{x}) - z_k^* \right| \right\}$

여기서 $z_k^* = \min_{\mathbf{x}} f_k(\mathbf{x})$ 는 각 목적 함수의 개별 최적값이다. 이 방법은 비볼록 프론티어를 포함한 임의의 파레토 프론티어를 근사할 수 있다.

3.2 진화 알고리즘 기반 해법

진화적 다목적 최적화(Evolutionary Multi-Objective Optimization, EMO) 알고리즘은 집단(population) 기반의 탐색을 통하여 파레토 프론티어의 근사 집합을 한 번의 실행으로 생성한다.

NSGA-II(Non-dominated Sorting Genetic Algorithm II): Deb 등(2002)이 제안한 알고리즘으로, 비지배 정렬(non-dominated sorting)과 군집 거리(crowding distance)를 결합하여 파레토 프론티어의 다양성과 수렴성을 동시에 추구한다.

알고리즘의 핵심 단계는:

비지배 정렬: 집단을 비지배 프론트(front)별로 분류
군집 거리 계산: 동일 프론트 내에서 해의 분포 밀도를 평가
토너먼트 선택: 비지배 순위(rank)와 군집 거리에 기반한 선택
교차·돌연변이: 유전 연산자를 적용한 자손 생성

MOEA/D(Multi-Objective Evolutionary Algorithm based on Decomposition): Zhang과 Li(2007)가 제안한 알고리즘으로, 다목적 문제를 복수의 스칼라 하위 문제(subproblem)로 분해하고, 이웃하는 하위 문제 간의 정보를 공유하면서 병렬적으로 최적화한다.

3.3 메타휴리스틱 기반 해법

입자 군집 최적화(Multi-Objective Particle Swarm Optimization, MOPSO), 다목적 시뮬레이티드 어닐링(Multi-Objective Simulated Annealing, MOSA), 다목적 개미 군집 최적화(Multi-Objective Ant Colony Optimization, MOACO) 등의 메타휴리스틱 기법도 로봇 임무 계획의 다목적 최적화에 적용된다.

4. 다목적 임무 평가 지표

4.1 파레토 프론티어의 품질 평가

파레토 프론티어 근사 집합의 품질을 평가하기 위한 지표는 다음과 같다.

초체적(Hypervolume, HV): 파레토 근사 집합과 참조점(reference point) $\mathbf{z}^{\text{ref}}$ 사이의 목적 공간에서의 초체적이다:

$\text{HV}(\mathcal{A}) = \text{vol}\!\left(\bigcup_{\mathbf{f} \in \mathcal{A}} [\mathbf{f}, \mathbf{z}^{\text{ref}}]\right)$

초체적이 클수록 파레토 근사의 품질이 우수하다. 초체적은 수렴성(convergence)과 다양성(diversity)을 동시에 반영하는 유일한 단항(unary) 지표이다(Zitzler and Thiele, 1999).

세대 거리(Generational Distance, GD): 파레토 근사 집합의 각 점에서 참 파레토 프론티어까지의 평균 거리이다:

$\text{GD}(\mathcal{A}) = \frac{1}{|\mathcal{A}|} \left( \sum_{\mathbf{f} \in \mathcal{A}} d(\mathbf{f}, \mathcal{F}^*)^p \right)^{1/p}$

여기서 $d(\mathbf{f}, \mathcal{F}^*)$ 는 점 $\mathbf{f}$ 에서 참 파레토 프론티어 $\mathcal{F}^*$ 까지의 최소 거리이다.

역세대 거리(Inverted Generational Distance, IGD): 참 파레토 프론티어의 각 점에서 파레토 근사 집합까지의 평균 거리이다. GD보다 근사의 다양성을 더 잘 반영한다.

확산(Spread): 파레토 근사 집합의 분포 균일성을 측정한다:

$\Delta = \frac{d_f + d_l + \sum_{i=1}^{N-1} |d_i - \bar{d}|}{d_f + d_l + (N-1)\bar{d}}$

여기서 $d_i$ 는 연속되는 비지배 해 사이의 거리, $d_f$ 와 $d_l$ 은 양 끝 극단 해까지의 거리, $\bar{d}$ 는 평균 거리이다.

4.2 임무 수준 평가 지표

로봇 임무의 다목적 평가에서 사용되는 도메인 특화 지표는 다음을 포함한다:

평가 차원	지표	정식화
효율성	임무 완료 시간	$C_{\max} = \max_i e_i$
에너지 효율	에너지 소비율 대비 성과	$\eta_E = \frac{\text{performance}}{\sum E_i}$
범위	탐색 범위율(coverage rate)	$\eta_C = \frac{A_{\text{covered}}}{A_{\text{total}}}$
안전성	최소 장애물 거리	$d_{\text{safe}}^{\min} = \min_t d_{\text{obs}}(t)$
강건성	교란 하 성능 저하율	$\Delta J / J_{\text{nominal}}$
공정성	로봇 간 작업 부하 편차	$\sigma_{\text{load}} / \mu_{\text{load}}$

5. 의사 결정 지원

5.1 사전(A Priori) 방법

의사 결정자의 선호 정보가 최적화 이전에 제공되는 방법이다. 가중합 방법에서 가중치를 미리 설정하거나, 목표 프로그래밍(goal programming)에서 각 목적 함수의 희망 수준(aspiration level) $\bar{f}_k$ 를 설정한다:

$\min_{\mathbf{x}} \sum_{k=1}^{K} w_k \left| f_k(\mathbf{x}) - \bar{f}_k \right|^p$

$p = 1$ 이면 가중 절대 편차, $p = 2$ 이면 가중 유클리드 편차이다.

5.2 사후(A Posteriori) 방법

파레토 프론티어를 먼저 생성한 후, 의사 결정자가 프론티어 상에서 최종 운용점(operating point)을 선택하는 방법이다. 시각화 도구를 통한 파레토 프론티어의 대화식(interactive) 탐색이 지원된다.

파레토 프론티어 상에서의 대표 해 선택을 위한 기법:

무릎점(Knee Point) 선택: 파레토 프론티어의 곡률이 가장 큰 점을 선택한다. 무릎점은 하나의 목적 함수를 소폭 개선하기 위하여 다른 목적 함수를 대폭 희생하여야 하는 경계점에 해당한다.
TOPSIS(Technique for Order of Preference by Similarity to Ideal Solution): 이상 해(ideal solution)와의 거리가 최소이고 비이상 해(anti-ideal solution)와의 거리가 최대인 해를 선택한다.

5.3 대화식(Interactive) 방법

최적화 과정에서 의사 결정자와 알고리즘이 반복적으로 상호 작용하면서 선호를 점진적으로 반영하는 방법이다. NIMBUS(Nondifferentiable Interactive Multiobjective Bundle-based Optimization System) 등이 이에 해당한다.

6. 로봇 임무 관리에의 적용

6.1 감시 임무의 다목적 평가

영역 감시(area surveillance) 임무에서 전형적인 다목적 문제는:

$\min \bigl[f_{\text{time}}(\pi), \; f_{\text{energy}}(\pi), \; 1 - f_{\text{coverage}}(\pi)\bigr]$

시간을 단축하면 속도 증가로 에너지 소비가 증가하고, 범위를 확장하면 시간과 에너지가 모두 증가하는 상충 관계가 존재한다.

6.2 물류 임무의 다목적 평가

물류(logistics) 임무에서:

$\min \bigl[f_{\text{cost}}(\pi), \; f_{\text{delay}}(\pi), \; f_{\text{risk}}(\pi)\bigr]$

비용 절감은 저속 경로를 선호하여 배송 지연을 증가시키고, 위험 경로의 회피는 경로 길이와 비용을 증가시킨다.

6.3 재난 구조 임무의 다목적 평가

재난 구조 임무에서는 인명 구조 확률이 최우선 목적이다:

$\min \bigl[-f_{\text{rescue}}(\pi), \; f_{\text{time}}(\pi), \; f_{\text{risk\_robot}}(\pi)\bigr]$

구조 확률의 극대화와 탐색 시간의 최소화는 로봇의 위험 노출 증가를 수반하므로, 안전성과의 균형이 필요하다.

7. 참고문헌

Deb, K., Pratap, A., Agarwal, S., and Meyarivan, T. (2002). “A Fast and Elitist Multiobjective Genetic Algorithm: NSGA-II.” IEEE Transactions on Evolutionary Computation, 6(2), 182–197.
Zhang, Q. and Li, H. (2007). “MOEA/D: A Multiobjective Evolutionary Algorithm Based on Decomposition.” IEEE Transactions on Evolutionary Computation, 11(6), 712–731.
Zitzler, E. and Thiele, L. (1999). “Multiobjective Evolutionary Algorithms: A Comparative Case Study and the Strength Pareto Approach.” IEEE Transactions on Evolutionary Computation, 3(4), 257–271.
Miettinen, K. (1999). Nonlinear Multiobjective Optimization. Springer.
Coello Coello, C. A., Lamont, G. B., and van Veldhuizen, D. A. (2007). Evolutionary Algorithms for Solving Multi-Objective Problems. 2nd Edition, Springer.
Branke, J., Deb, K., Miettinen, K., and Słowiński, R. (2008). Multiobjective Optimization: Interactive and Evolutionary Approaches. Springer.

본 절은 로봇공학 서적 Volume 9, Part 53, Chapter 396의 일부로 작성되었다. 버전: 2026-03-24 v2.0