397.85 물류 로봇 입출고 오더 배치 기반 멀티 픽업 임무 계획

1. 개요

물류 로봇(Logistics Robot)을 활용한 입출고(Inbound/Outbound) 오더 처리는 현대 물류 자동화 시스템의 핵심 운용 형태이다. 특히, 복수의 오더를 배치(Batch)로 묶어 하나의 로봇이 여러 품목을 순차적으로 픽업(Pickup)하는 멀티 픽업(Multi-Pickup) 임무는, 개별 오더를 단건 처리하는 방식에 비해 현저히 높은 처리량(Throughput)과 에너지 효율을 달성할 수 있다(Boysen et al., 2019).

이 절에서는 물류 로봇의 멀티 픽업 임무 계획 문제를 체계적으로 분석하고, 오더 배치(Order Batching), 작업 할당(Task Allocation), 픽업 경로 최적화(Pickup Route Optimization), 그리고 동적 재계획(Dynamic Replanning)의 관점에서 적용 가능한 임무 계획 기법을 고찰한다.

2. 물류 로봇 시스템의 구성

2.1 물류 환경 모델링

물류 로봇이 운용되는 창고(Warehouse) 환경은 다음의 구성 요소로 모델링된다:

공간 구조: 창고는 통로(Aisle), 적재 랙(Storage Rack), 피킹 스테이션(Picking Station), 충전 스테이션(Charging Station), 그리고 입출고 도크(Dock)로 구성된다. 공간 구조는 그래프 $G = (V, E)$ 로 표현되며, 정점 $V$ 는 교차점, 적재 위치, 스테이션 등의 주요 지점을, 간선 $E$ 는 로봇이 이동 가능한 경로를 나타낸다.

적재 위치: 각 SKU(Stock Keeping Unit, 재고 관리 단위)는 하나 이상의 적재 위치(Storage Location) $l \in \mathcal{L}$ 에 보관된다. 적재 위치 $l$ 은 통로 번호, 랙 번호, 층 번호, 열 번호로 식별되며, 해당 위치에 보관된 SKU의 종류와 수량 정보를 포함한다.

로봇 집합: $\mathcal{R} = \{r_1, r_2, \ldots, r_K\}$ 를 $K$ 대의 물류 로봇 집합이라 하자. 각 로봇 $r_i$ 는 다음의 속성을 보유한다:

최대 적재 용량(Payload Capacity) $Q_i$
이동 속도 $v_i$
현재 배터리 잔량 $B_i$
현재 위치 $p_i$
적재 상태(현재 탑재 품목 목록)

2.2 오더 구조

오더(Order) $o_j = \{(s_1, q_1), (s_2, q_2), \ldots, (s_{n_j}, q_{n_j})\}$ 는 SKU-수량 쌍의 집합으로 정의된다. 여기서 $s_k$ 는 요구 SKU, $q_k$ 는 해당 SKU의 요구 수량이다. 각 오더는 다음의 속성을 추가로 보유한다:

오더 유형: 입고(Inbound) 또는 출고(Outbound)
우선순위 등급: 긴급(Urgent), 일반(Normal), 저순위(Low)
마감 시한(Deadline) $d_j$
발주처(Customer/Supplier) 정보

3. 오더 배치 문제

3.1 오더 배치의 수학적 정의

오더 배치(Order Batching)는 개별 오더들을 그룹(배치)으로 묶어, 각 배치를 하나의 멀티 픽업 임무로 처리하는 과정이다. 오더 배치 문제는 다음과 같이 정형화된다.

주어진 오더 집합 $\mathcal{O} = \{o_1, o_2, \ldots, o_n\}$ 을 배치 집합 $\mathcal{B} = \{B_1, B_2, \ldots, B_m\}$ 으로 분할하라. 단, 다음의 제약을 만족해야 한다:

$\bigcup_{k=1}^{m} B_k = \mathcal{O}, \quad B_i \cap B_j = \emptyset \; (i \neq j)$

$\sum_{o_j \in B_k} V(o_j) \leq Q_{\text{max}}, \quad \forall B_k \in \mathcal{B}$

여기서 $V(o_j)$ 는 오더 $o_j$ 의 총 체적(또는 중량)이며, $Q_{\text{max}}$ 는 로봇의 최대 적재 용량이다.

최적화 목표는 전체 처리 시간을 최소화하는 것이다:

$\min \sum_{k=1}^{m} T(B_k)$

여기서 $T(B_k)$ 는 배치 $B_k$ 의 총 처리 시간으로, 이동 시간, 픽업 시간, 그리고 대기 시간의 합이다.

배치 구성 알고리즘

근접성 기반 배치(Proximity-Based Batching)

근접성 기반 배치는 적재 위치의 공간적 근접성을 기준으로 오더를 그룹화한다. 오더 간의 거리는 해당 오더에 포함된 SKU의 적재 위치 간 최단 경로 거리의 합 또는 최대값으로 정의된다.

두 오더 $o_i$ 와 $o_j$ 사이의 거리는 다음과 같이 정의할 수 있다:

$d(o_i, o_j) = \sum_{l_a \in L(o_i)} \sum_{l_b \in L(o_j)} \frac{d_{\text{path}}(l_a, l_b)}{|L(o_i)| \cdot |L(o_j)|}$

여기서 $L(o_i)$ 는 오더 $o_i$ 에 포함된 SKU들의 적재 위치 집합이고, $d_{\text{path}}(l_a, l_b)$ 는 위치 $l_a$ 에서 $l_b$ 까지의 최단 경로 거리이다.

3.1.1 시간 창 기반 배치(Time-Window Based Batching)

마감 시한이 유사한 오더들을 우선적으로 배치하여, 마감 위반(Deadline Violation)을 최소화한다. 시간 창(Time Window) $[e_j, d_j]$ (최조 처리 가능 시점 $e_j$ , 마감 시한 $d_j$ )이 중첩되는 오더들을 동일 배치에 할당한다:

$B_k = \{o_j : [e_j, d_j] \cap [e_k^B, d_k^B] \neq \emptyset\}$

여기서 $[e_k^B, d_k^B]$ 는 배치 $B_k$ 의 시간 창이다.

하이브리드 배치 알고리즘

실무적으로는 근접성과 시간 제약을 동시에 고려하는 하이브리드 배치 알고리즘이 활용된다. 다목적 최적화 프레임워크를 적용하여, 이동 거리 최소화와 마감 준수율 최대화를 동시에 추구한다:

$\min \alpha \cdot \sum_{k} D(B_k) + \beta \cdot \sum_{j} \max(0, C_j - d_j)$

여기서 $D(B_k)$ 는 배치 $B_k$ 의 총 이동 거리, $C_j$ 는 오더 $o_j$ 의 예상 완료 시각, $\alpha$ 와 $\beta$ 는 각 목표의 가중치이다.

4. 멀티 픽업 경로 최적화

4.1 외판원 문제로의 정형화

하나의 배치에 대한 멀티 픽업 경로 최적화는 외판원 문제(Traveling Salesman Problem, TSP)의 변형으로 정형화된다. 로봇이 시작 위치에서 출발하여 배치 내 모든 SKU의 적재 위치를 방문하고, 피킹 스테이션으로 이동하는 최단 경로를 찾는 문제이다.

배치 $B_k$ 에 포함된 SKU들의 적재 위치 집합을 $L_k = \{l_1, l_2, \ldots, l_{|L_k|}\}$ 로 하고, 시작 위치를 $l_0$ , 피킹 스테이션을 $l_{|L_k|+1}$ 로 설정하면, 최적 경로 $\pi^*$ 는 다음을 만족한다:

$\pi^* = \arg\min_{\pi} \sum_{i=0}^{|L_k|} d_{\text{path}}(l_{\pi(i)}, l_{\pi(i+1)})$

여기서 $\pi$ 는 방문 순서의 순열(Permutation)이다.

창고 특화 휴리스틱

일반적인 TSP 휴리스틱 외에, 창고의 통로 구조를 활용한 특화 휴리스틱이 존재한다:

S자형 전략(S-Shape Strategy): 로봇이 통로를 한 방향으로 통과하면서 해당 통로 내의 모든 적재 위치를 방문한다. 구현이 단순하지만, 방문 지점이 적은 통로에서는 비효율적이다.

최대 갭 전략(Largest Gap Strategy): 각 통로에서 가장 큰 간격(Gap)을 기준으로 양쪽에서 진입하여 방문한다. S자형 전략보다 단축된 경로를 생성하는 경우가 많다.

리턴 전략(Return Strategy): 로봇이 각 통로에 한쪽 끝에서 진입하고, 모든 방문을 마친 후 동일한 끝으로 되돌아 나온다. 한 통로 내 방문 지점이 통로 입구 근처에 집중된 경우 효율적이다.

합성 전략(Combined Strategy): 각 통로에 대해 S자형, 최대 갭, 리턴 전략 중 최단 경로를 생성하는 전략을 동적으로 선택한다. 동적 프로그래밍(Dynamic Programming)을 활용하여 각 통로 쌍 사이의 최적 전환을 결정한다(Roodbergen & de Koster, 2001).

선후 관계 제약이 있는 경로 계획

멀티 픽업 경로에서 특정 품목의 픽업 순서에 선후 관계 제약이 존재할 수 있다. 예를 들어, 중량품은 경량품보다 먼저 적재하여 안정성을 확보해야 하거나, 위험물은 특정 품목과의 동시 적재가 제한될 수 있다.

이러한 선후 관계 제약은 방향성 비순환 그래프(Directed Acyclic Graph, DAG)로 표현되며, 위상 정렬(Topological Sort)을 통해 유효한 방문 순서를 결정한 후, 해당 순서 제약 내에서의 최단 경로를 탐색한다.

멀티 로봇 작업 할당

배치-로봇 할당 문제

구성된 배치들을 로봇에 할당하는 문제는 할당 문제(Assignment Problem)로 정형화된다. $m$ 개의 배치를 $K$ 대의 로봇에 할당할 때, 총 처리 시간을 최소화하는 할당을 구하는 것이 목표이다.

이진 결정 변수 $x_{ik} \in \{0, 1\}$ 를 배치 $B_i$ 가 로봇 $r_k$ 에 할당되면 1, 아니면 0으로 정의하면:

$\min \max_{k} \sum_{i=1}^{m} x_{ik} \cdot T_k(B_i) \quad \text{(최대 완료 시간, 메이크스팬 최소화)}$

제약 조건:

$\sum_{k=1}^{K} x_{ik} = 1, \quad \forall i \quad \text{(각 배치 정확히 하나의 로봇에 할당)}$

$\sum_{i} x_{ik} \cdot V(B_i) \leq Q_k, \quad \forall k \quad \text{(용량 제약)}$

$\sum_{i} x_{ik} \cdot E_k(B_i) \leq B_k, \quad \forall k \quad \text{(에너지 제약)}$

여기서 $T_k(B_i)$ 는 로봇 $r_k$ 가 배치 $B_i$ 를 처리하는 데 소요되는 예상 시간, $E_k(B_i)$ 는 소요 에너지이다.

온라인 할당 전략

실제 물류 환경에서는 오더가 실시간으로 도착하므로, 오프라인 최적 할당보다는 온라인 할당 전략이 요구된다. 대표적인 온라인 할당 전략은 다음과 같다:

최소 부하 할당(Least Loaded Assignment): 현재 가장 적은 작업 부하를 가진 로봇에 새로운 배치를 할당한다.

최소 이동 거리 할당(Nearest Robot Assignment): 새로운 배치의 첫 번째 픽업 위치에 가장 가까운 유휴 로봇에 할당한다.

경매 기반 할당(Auction-Based Assignment): 각 로봇이 새로운 배치에 대한 비용을 입찰하고, 최소 비용을 입찰한 로봇에 할당한다. 비용은 이동 거리, 현재 배터리 잔량, 현재 작업 부하를 종합적으로 반영한다.

충돌 회피와 교통 관리

창고 내 교통 관리 시스템

복수의 물류 로봇이 동일 공간에서 동시에 운용되면, 통로 교차점에서의 충돌과 교착(Deadlock)이 발생할 수 있다. 이를 방지하기 위한 교통 관리 시스템은 임무 계획의 중요한 보조 요소이다.

시간-공간 예약 테이블(Time-Space Reservation Table): 각 로봇의 예상 이동 경로와 시간을 예약 테이블에 등록하고, 시간-공간 충돌이 발생하는 경우 해당 로봇의 경로 또는 출발 시점을 조정한다.

우선순위 기반 양보 규칙(Priority-Based Yielding Rule): 로봇 간 우선순위를 정의하고(예: 마감이 임박한 배치를 운반하는 로봇이 높은 우선순위), 우선순위가 낮은 로봇이 양보하도록 한다.

일방통행 통로(One-Way Aisle): 주요 통로에 일방통행 규칙을 적용하여 정면 충돌을 원천적으로 방지한다. 일방통행 방향의 설정은 주요 교통 흐름 분석을 기반으로 결정된다.

다중 에이전트 경로 찾기

다중 에이전트 경로 찾기(Multi-Agent Pathfinding, MAPF) 기법은 복수 로봇의 충돌 없는 경로를 동시에 계획한다. 대표적인 알고리즘으로는 CBS(Conflict-Based Search)(Sharon et al., 2015)가 있다:

상위 수준(High Level): 각 로봇에 대해 개별 최적 경로를 계산하고, 로봇 간 충돌을 식별한다.
충돌 해결: 충돌이 발견되면, 관련 로봇에 시간-공간 제약을 추가하여 해당 충돌을 회피하는 새로운 경로를 재계산한다.
분기 탐색: 충돌 해결 과정에서 새로운 충돌이 발생할 수 있으므로, 이진 분기 구조를 통해 모든 충돌이 해결된 해를 탐색한다.

동적 재계획 시나리오

긴급 오더 삽입

높은 우선순위의 긴급 오더가 도착하면, 현재 진행 중인 배치에 삽입하거나 새로운 배치를 즉시 생성하여 처리한다. 삽입 판정 기준은 다음과 같다:

현재 진행 중인 배치에 잔여 용량이 있는가?
긴급 오더의 적재 위치가 현재 경로 인근에 있는가?
삽입으로 인한 경로 연장이 허용 한계 이내인가?
기존 오더의 마감 준수에 영향을 미치지 않는가?

삽입 비용은 다음과 같이 계산된다:

$C_{\text{insert}} = d_{\text{path}}(l_{\pi(i)}, l_{\text{urgent}}) + d_{\text{path}}(l_{\text{urgent}}, l_{\pi(i+1)}) - d_{\text{path}}(l_{\pi(i)}, l_{\pi(i+1)})$

여기서 $l_{\text{urgent}}$ 는 긴급 오더의 적재 위치, $l_{\pi(i)}$ 와 $l_{\pi(i+1)}$ 는 현재 경로에서 삽입 후보 위치의 전후 정점이다.

4.2 재고 위치 변경 대응

피킹 대상 SKU의 적재 위치에 재고가 부족하거나 위치가 변경된 경우, 대체 적재 위치로의 경로 변경이 필요하다. 창고 관리 시스템(WMS, Warehouse Management System)과의 실시간 연동을 통해 재고 정보를 갱신하고, 최적의 대체 위치를 선택하여 경로를 재계획한다.

4.3 로봇 고장 및 통로 차단 대응

로봇 고장이나 통로 차단(장애물, 유지보수 작업 등) 발생 시, 영향받는 배치의 재할당과 경로 재계획이 수행된다. 고장 로봇에 할당된 미완료 배치는 다른 가용 로봇에 재할당되며, 차단된 통로를 우회하는 경로가 재계산된다.

5. 성능 평가 지표

물류 로봇 멀티 픽업 임무 계획의 성능은 다음의 지표를 통해 평가한다:

평가 지표	정의	단위
처리량(Throughput)	단위 시간당 처리 완료 오더 수	오더/시간
메이크스팬(Makespan)	전체 배치의 최대 완료 시간	초
평균 오더 사이클 타임	오더 접수부터 완료까지의 평균 시간	초
마감 준수율	마감 시한 내 완료된 오더의 비율	%
로봇 가동률	로봇의 유효 작업 시간 / 전체 운용 시간	%
평균 이동 거리	배치당 평균 로봇 이동 거리	미터
에너지 효율	처리 오더당 에너지 소모량	Wh/오더
배치 충전율	배치당 평균 적재 용량 사용률	%

6. 실제 적용 사례

6.1 고밀도 자동 창고 시스템

Amazon Robotics(구 Kiva Systems)의 로봇 풀필먼트 센터(Robot Fulfillment Center)는 물류 로봇 멀티 픽업 임무 계획의 대표적 적용 사례이다(Wurman et al., 2008). 이 시스템에서는 로봇이 적재 랙 자체를 피킹 스테이션으로 운반하는 “물품이 사람에게 오는(Goods-to-Person)” 방식을 채택하며, 수백 대의 로봇이 동시에 운용된다. 이 시스템의 임무 계획은 랙 선택, 로봇 할당, 경로 계획, 충돌 회피를 통합적으로 관리한다.

6.2 반도체 공장 물류

반도체 공장(Fab)의 AMHS(Automated Material Handling System)에서 OHT(Overhead Hoist Transport) 또는 AGV(Automated Guided Vehicle)를 활용한 웨이퍼 카세트 운반은, 엄격한 시간 제약과 세정 환경 제약 하에서의 멀티 픽업 임무 계획을 요구한다. 각 공정 장비 간의 웨이퍼 카세트 운반 순서는 공정 선후 관계에 의해 결정되며, 오염 방지를 위한 경로 제약이 추가된다.

6.3 전자 상거래 물류 센터

전자 상거래 물류 센터에서의 멀티 픽업 임무는 높은 오더 변동성(Peak Hour 대응)과 다품종 소량 피킹의 특성을 보인다. 이 환경에서는 배치 구성의 동적 최적화와 실시간 재계획 능력이 핵심적이며, 시간대별 오더 유입 패턴을 학습하여 예측적 배치 구성(Predictive Batching)을 수행하는 기법이 연구되고 있다.

7. 참고 문헌

Boysen, N., de Koster, R., & Weidinger, F. (2019). “Warehousing in the E-Commerce Era: A Survey.” European Journal of Operational Research, 277(2), 396-411.
Roodbergen, K. J., & de Koster, R. (2001). “Routing Methods for Warehouses with Multiple Cross Aisles.” International Journal of Production Research, 39(9), 1865-1883.
Sharon, G., Stern, R., Felner, A., & Sturtevant, N. R. (2015). “Conflict-Based Search for Optimal Multi-Agent Pathfinding.” Artificial Intelligence, 219, 40-66.
Wurman, P. R., D’Andrea, R., & Mountz, M. (2008). “Coordinating Hundreds of Cooperative, Autonomous Vehicles in Warehouses.” AI Magazine, 29(1), 9-20.
de Koster, R., Le-Duc, T., & Roodbergen, K. J. (2007). “Design and Control of Warehouse Order Picking: A Literature Review.” European Journal of Operational Research, 182(2), 481-501.