
컴퓨터 그래픽스, 컴퓨터 비전, 그리고 로보틱스 분야의 발전은 3차원 공간과 그 안에 존재하는 객체를 어떻게 효율적이고 정확하게 디지털 데이터로 표현하는가에 대한 근본적인 질문과 함께해왔다.1 전통적으로 3D 형상을 표현하는 주류 방식은 명시적(explicit) 표현이었다. 이는 객체의 표면을 직접적으로 기술하는 방식으로, 가장 대표적인 예로는 다각형 메시(polygonal mesh)와 포인트 클라우드(point cloud)가 있다. 다각형 메시는 정점(vertex), 간선(edge), 면(face)의 집합으로 표면을 구성하며, 렌더링 파이프라인에 친화적이라는 장점 때문에 오랫동안 표준으로 사용되어 왔다. 포인트 클라우드는 LiDAR나 깊이 카메라와 같은 3D 스캐닝 장비로부터 직접 얻어지는 3D 점들의 집합으로, 원시 데이터(raw data)를 그대로 표현하는 가장 단순한 형태이다.3
그러나 이러한 명시적 표현 방식들은 본질적인 한계를 가진다. 첫째, 위상(topology) 변화에 취약하다. 예를 들어, 두 객체가 합쳐지거나 하나의 객체가 쪼개지는 현상을 메시 구조로 표현하려면 복잡한 재메싱(remeshing) 과정이 필요하다. 둘째, 불완전한 데이터 처리가 어렵다. 실제 센서로부터 얻어진 포인트 클라우드는 구멍(hole), 노이즈(noise), 불균일한 밀도 등 다양한 결함을 포함하는데, 이러한 데이터로부터 온전하고 닫힌(watertight) 메시를 재구성하는 것은 매우 어려운 문제이다.1 또한, 표현의 정밀도가 정점이나 점의 개수에 직접적으로 의존하기 때문에, 고품질의 형상을 표현하기 위해서는 막대한 양의 데이터가 필요하다는 단점도 존재한다.
이러한 명시적 표현의 한계를 극복하기 위한 대안으로 암시적(implicit) 표현 방식이 부상하였다. 암시적 표현은 표면 자체를 직접 기술하는 대신, 공간상의 한 점이 주어진 형상의 내부에 있는지, 외부에 있는지, 혹은 표면 위에 있는지를 판별하는 함수 $f(x, y, z)$를 통해 기하를 간접적으로 정의한다.5 표면은 이 함수의 특정 등위 집합(level set), 예를 들어 $f(x,y,z)=0$을 만족하는 점들의 집합으로 정의된다.
이러한 접근 방식은 여러 강력한 장점을 제공한다. 첫째, 표현이 연속적(continuous)이다. 이산적인 점이나 면이 아닌 연속 함수로 공간 전체를 정의하기 때문에, 이론적으로 무한한 해상도를 가지며 이산화로 인한 계단 현상(aliasing)이 없다.8 둘째, 메모리 효율성이 높을 수 있다. 복잡한 형상이라도 상대적으로 적은 수의 파라미터를 가진 함수로 표현할 수 있기 때문이다. 셋째, 견고한 기하 연산이 가능하다. 두 형상의 합집합, 교집합, 차집합과 같은 구성적 입체 기하(Constructive Solid Geometry, CSG) 연산을 간단한 함수 연산으로 처리할 수 있으며, 위상 변화에 자연스럽게 대처할 수 있다.9
다양한 암시적 표현 중에서도 가장 널리 사용되고 강력한 도구가 바로 부호 거리 필드(Signed Distance Field, SDF)이다. SDF는 공간의 모든 점 x에 대해, 그 점에서 가장 가까운 표면까지의 거리를 값으로 가지고, 그 부호(sign)를 통해 점이 표면의 내부에 있는지 외부에 있는지를 나타내는 스칼라 필드(scalar field)이다.7 일반적으로 표면의 내부는 음수(SDF<0), 외부는 양수(SDF>0), 그리고 표면 자체는 0(SDF=0)으로 정의된다.5 이처럼 SDF는 단순한 점유(occupancy) 정보를 넘어, 표면까지의 ‘거리’라는 풍부한 메트릭 정보를 공간 전체에 걸쳐 제공한다.
본 보고서는 수많은 SDF 변형 중에서도 가장 기본적이면서도 중요한 유클리드 부호 거리 필드(Euclidean Signed Distance Field, ESDF)에 대한 심층적인 고찰을 목표로 한다. ESDF는 거리 측정의 기준으로 우리에게 가장 직관적인 유클리드 거리(Euclidean distance)를 사용한다. 보고서는 먼저 ESDF의 수학적 정의와 핵심적인 특성을 분석하고, 이어서 ESDF를 생성하는 다양한 고전적 및 최신 알고리즘들을 원리 중심으로 상세히 설명할 것이다. 다음으로 컴퓨터 그래픽스와 로보틱스라는 두 핵심 분야에서 ESDF가 어떻게 활용되어 혁신적인 기술들을 가능하게 했는지 구체적인 사례를 통해 분석한다. 마지막으로, TSDF(Truncated Signed Distance Field)와 같은 연관 표현 방식과의 비교를 통해 그 차이점과 장단점을 명확히 하고, 최근 3D 딥러닝의 부상과 함께 등장한 신경망 기반 SDF 패러다임의 최신 동향까지 아우르며 ESDF의 현재와 미래를 종합적으로 조망하고자 한다.
ESDF의 수학적 정의를 엄밀하게 내리기 위해서는 먼저 거리 공간(metric space)의 개념에서 출발해야 한다. 거리 공간 $(X, d)$가 주어졌을 때, 이 공간의 부분집합 Ω⊂X를 하나의 3D 형상으로 생각할 수 있다. 이때 ∂Ω는 형상 Ω의 경계(boundary), 즉 표면을 나타낸다.
공간상의 임의의 한 점 x∈X에서 집합 ∂Ω까지의 거리는 점 x와 ∂Ω에 속하는 모든 점 y 사이의 거리 d(x,y) 중 가장 작은 값으로 정의된다. 수학적으로 이는 하한(infimum)을 사용하여 다음과 같이 표현된다.7
\(d(x, \partial\Omega) = \inf_{y \in \partial\Omega} d(x, y)\)
여기서 inf는 집합의 가장 큰 하계(greatest lower bound)를 의미하며, 이는 최소값(minimum)이 존재하지 않을 수 있는 경우까지 포함하는 더 일반적인 개념이다. 유클리드 공간과 같은 완비 거리 공간(complete metric space)에서는 이 값이 항상 존재하며, 가장 가까운 점이 실제로 존재하므로 최소값과 동일하다.
이 거리 함수를 기반으로, 부호(sign)를 추가하여 부호 거리 함수(SDF) $f(x)$를 정의할 수 있다. 부호는 점 x가 형상 Ω의 내부에 있는지, 아니면 외부에 있는지에 따라 결정된다. 컴퓨터 그래픽스와 로보틱스 분야에서 널리 사용되는 일반적인 관례(convention)는 형상의 내부를 음수(-), 외부를 양수(+)로 정의하는 것이다.5 이 관례에 따른 ESDF의 공식적인 정의는 다음과 같다.7
\(f(x) = \begin{cases} d(x, \partial\Omega) & \text{if } x \in \Omega^c \\ 0 & \text{if } x \in \partial\Omega \\ -d(x, \partial\Omega) & \text{if } x \in \Omega \end{cases}\) 여기서 Ωc는 Ω의 여집합, 즉 형상의 외부를 의미한다. 이 정의에 따르면, ESDF의 값은 표면으로부터 멀어질수록 절댓값이 커지며, 부호를 통해 내/외부를 즉시 판별할 수 있다.
다만, 일부 문헌이나 응용에서는 내부를 양수, 외부를 음수로 정의하는 반대의 관례를 채택하기도 하므로 7, 특정 구현이나 논문을 참조할 때는 해당 문서에서 사용하는 부호 관례를 명확히 확인하는 것이 매우 중요하다.
ESDF는 단순한 거리 정보의 집합을 넘어, 응용에 매우 유용한 여러 가지 강력한 수학적 특성을 지닌다.
미분 가능성 (Differentiability)
만약 형상 Ω의 경계 ∂Ω가 조각적으로 매끄럽다면(piecewise smooth), ESDF 함수 $f(x)$는 경계를 제외한 거의 모든 곳에서(almost everywhere) 미분 가능하다.7 이는 ESDF가 제공하는 가장 강력하고 실용적인 장점 중 하나이다. 미분 가능성은 그래디언트(gradient)를 계산할 수 있음을 의미하며, 이는 후술할 표면 법선 벡터 계산이나 최적화 기반 알고리즘 적용의 근간이 된다.
아이코날 방정식 (Eikonal Equation)
ESDF의 그래디언트 벡터 ∇f의 크기(magnitude)는 경계를 제외한 모든 점에서 항상 1이다.
\(|\nabla f| = 1\) 이 식은 아이코날 방정식(Eikonal equation)으로 알려져 있으며, 빛이나 파동의 전파(wave propagation) 현상을 모델링하는 편미분 방정식이다.7 ESDF가 이 방정식을 만족한다는 사실은 거리 필드가 파면이 일정한 속도로 퍼져나가는 것과 유사한 성질을 가짐을 의미하며, 이는 Fast Marching Method와 같은 일부 ESDF 생성 알고리즘의 이론적 기반이 된다.
표면 법선 벡터 (Surface Normal Vector)
경계 ∂Ω 상의 한 점 x에서 ESDF의 그래디언트 $\nabla f(x)$는 그 점에서의 표면 법선 벡터(surface normal vector)와 방향이 같다. 앞서 정의한 관례(내부 음수, 외부 양수)에 따르면, 그래디언트는 거리가 증가하는 방향, 즉 표면의 외부를 향하므로 외향 법선 벡터(outward normal vector)가 된다. 만약 내향 법선 벡터 N이 필요하다면 그래디언트의 부호를 바꾸면 된다.7
\(N(x) = -\nabla f(x) \quad \text{for } x \in \partial\Omega\) 이 특성은 ESDF가 단순히 표면의 위치(f=0)뿐만 아니라 표면의 국소적인 방향 정보까지 암시적으로 인코딩하고 있음을 보여준다. 따라서 ESDF는 표면 법선 벡터 필드의 미분 가능한 확장(differentiable extension)으로 간주될 수 있다.7 이 법선 정보는 컴퓨터 그래픽스의 사실적인 렌더링을 위한 조명 계산이나 로보틱스에서 충돌 회피 방향을 결정하는 데 결정적인 역할을 한다.
ESDF의 ‘E’는 유클리드(Euclidean)를 의미하며, 이는 거리 측정의 기준으로 유클리드 거리 메트릭을 사용함을 명시한다. 그러나 실제 응용에서는 계산 효율성 등의 이유로 다른 거리 메트릭이 고려되기도 한다.
유클리드 거리 (L2 Norm)
유클리드 거리는 두 점 사이를 잇는 가장 짧은 직선 거리를 의미하며, 피타고라스 정리에 기반한다. 2차원 공간의 두 점 $p_1=(x_1, y_1)$과 p2=(x2,y2) 사이의 유클리드 거리는 다음과 같이 계산된다.12
\(d_{L2}(p_1, p_2) = \sqrt{(x_1-x_2)^2 + (y_1-y_2)^2}\) 이는 우리가 일상적으로 인식하는 ‘거리’와 가장 일치하는 기하학적으로 직관적이고 정확한 측정 방식이다. 따라서 ESDF는 가장 자연스러운 형태의 거리 필드를 생성한다.14
맨해튼 거리 (L1 Norm, Taxicab Geometry)
맨해튼 거리는 격자 형태의 도시에서 길을 따라 이동하는 것처럼, 각 좌표축을 따라서만 이동할 때의 거리 합으로 정의된다. 일명 택시 거리(taxicab geometry)라고도 불린다.12
\(d_{L1}(p_1, p_2) = |x_1-x_2| + |y_1-y_2|\) 맨해튼 거리의 가장 큰 장점은 계산의 단순함에 있다. 제곱근 연산이 필요한 유클리드 거리와 달리, 맨해튼 거리는 뺄셈과 덧셈만으로 계산이 가능하여 계산 비용이 매우 저렴하다. 이 때문에 실시간 성능이 극도로 중요한 일부 복셀 렌더링과 같은 응용에서는 정확도를 일부 희생하고 맨해튼 거리를 사용한 SDF를 근사치로 사용하기도 한다.7
메트릭 선택의 의미
거리 메트릭의 선택은 단순히 계산 방식의 차이를 넘어, 생성되는 거리 필드의 형태와 응용의 적합성에 근본적인 영향을 미친다. 이는 ‘정확성’과 ‘계산 효율성’ 사이의 고전적인 공학적 트레이드오프를 명확하게 보여준다.
기하학적 형상을 가장 충실하게 표현하는 것이 목표라면, 최단 거리를 나타내는 유클리드 거리가 당연히 표준이 되어야 한다. 하지만 실시간 시스템에서는 매 프레임마다 수백만 개의 복셀에 대해 거리 계산을 수행해야 할 수 있으며, 이때 유클리드 거리의 제곱근 연산은 상당한 계산 부하를 유발할 수 있다. 반면, 맨해튼 거리는 훨씬 빠른 계산 속도를 제공한다.
이러한 선택의 결과는 생성되는 SDF의 등고선(iso-contours)에서 명확하게 드러난다. 유클리드 거리 기반 SDF의 등고선은 점 소스(point source)로부터 원형(3D에서는 구형)으로 퍼져나가는 반면, 맨해튼 거리 기반 SDF의 등고선은 마름모 또는 정사각형(3D에서는 정팔면체) 형태로 나타난다.16 따라서, 응용 프로그램이 요구하는 기하학적 정확도 수준과 가용한 계산 자원을 신중하게 고려하여 적절한 거리 메트릭을 선택해야 한다. ‘ESDF’라는 용어는 암묵적으로 유클리드 거리를 가정하지만, 실제 구현에서는 성능 최적화를 위해 다른 메트릭이 사용될 수 있음을 항상 인지하고 있어야 한다.
ESDF를 계산하는 과정은 주어진 기하학적 표현(예: 이진 점유 격자, 다각형 메시)으로부터 공간의 각 지점까지의 최단 거리를 찾는 것으로, 이를 효율적으로 수행하기 위한 다양한 알고리즘이 개발되었다. 이 알고리즘들은 크게 환경이 변하지 않는다고 가정하고 한 번에 전체 필드를 계산하는 ‘배치(batch) 기법’과, 환경이 실시간으로 변하는 상황에 대응하여 변경된 부분만 업데이트하는 ‘점진적(incremental) 기법’으로 나눌 수 있다.
배치 기법은 주로 오프라인 환경에서 고정된 객체나 장면에 대한 ESDF를 생성할 때 사용된다. 가장 일반적인 출발점은 공간을 이산적인 복셀(voxel) 그리드로 나누고, 각 복셀이 장애물에 의해 ‘점유(occupied)’되었는지 혹은 ‘비어(free)’있는지를 나타내는 이진 점유 격자 지도(occupancy grid map)이다.10
거리 변환(Distance Transform, DT)
거리 변환은 이진 입력(예: 0과 1, 또는 true와 false)을 가진 그리드의 각 셀에 대해, ‘참(true)’ 또는 ‘점유’ 상태인 가장 가까운 셀까지의 거리를 계산하여 새로운 그리드를 생성하는 연산이다.10 ESDF를 생성하기 위해, 점유된 셀들을 ‘참’으로 간주하여 DT를 한 번 수행하고(내부 거리 필드), 비어있는 셀들을 ‘참’으로 간주하여 DT를 또 한 번 수행한 후(외부 거리 필드), 두 결과를 조합하여 부호를 부여하는 방식을 사용할 수 있다.10
Marching Parabolas 알고리즘 심층 분석
CPU 환경에서 매우 효율적인 ESDF 생성 알고리즘으로 Pedro Felzenszwalb와 Daniel Huttenlocher가 제안한 ‘Marching Parabolas’가 있다. 이 알고리즘은 그리드 크기 N에 대해 선형 시간(O(N))의 계산 복잡도를 가지므로 대규모 그리드에서도 빠른 성능을 보인다.10
이 알고리즘의 핵심 아이디어는 두 가지다. 첫째, 2차원 거리 변환을 두 개의 독립적인 1차원 거리 변환으로 분리(separable)하는 것이다. 이는 2D 이미지 필터를 가로 방향 패스와 세로 방향 패스로 나누어 적용하는 것과 유사하다. 이를 위해 먼저 이진 입력 그리드의 ‘점유’ 셀은 0으로, ‘비어있는’ 셀은 무한대(∞)로 초기화한다.10
둘째, 1차원 제곱 유클리드 거리 변환(Squared Euclidean Distance Transform, SEDT) 문제를 기하학적으로 재해석하는 것이다. 1차원 그리드의 각 점 i를 꼭짓점이 $(i, g(i))$에 위치한 표준 2차 포물선 $p_i(x) = (x-i)^2 + g(i)$으로 간주할 수 있다. 여기서 $g(i)$는 초기 그리드의 값(0 또는 ∞)이다. 그러면 1차원 SEDT는 이 포물선들의 집합에 대한 하위 포락선(lower envelope), 즉 아래쪽 경계선을 찾는 문제와 동일해진다.10
Marching Parabolas 알고리즘은 다음 단계로 수행된다 10:
find_hull_parabolas): 왼쪽에서 오른쪽으로 스캔하면서 포물선들을 순차적으로 추가한다. 새로운 포물선이 기존의 하위 껍질을 형성하던 포물선을 완전히 가리게 되면(occlude), 기존 포물선을 제거한다. 이 과정을 통해 최종적으로 하위 포락선을 구성하는 포물선들의 목록과 그들의 교차점을 찾는다.march_parabolas): 결정된 하위 껍질을 따라 다시 왼쪽에서 오른쪽으로 이동하며, 각 픽셀 위치에서 현재 구간에 해당하는 포물선의 y값(제곱 거리)을 계산하여 저장한다.GPU 가속 기법
대규모 병렬 처리가 가능한 GPU의 발달로, ESDF 생성을 가속화하는 다양한 기법들이 제안되었다.
로봇이 미지의 환경을 탐색하거나, 환경 내에 움직이는 장애물이 있는 동적 시나리오에서는 매 순간 센서 정보가 갱신된다. 이러한 상황에서 매번 전체 맵에 대해 배치 알고리즘을 실행하는 것은 극심한 계산 낭비이다. 따라서 변경된 부분만 효율적으로 업데이트하는 점진적(incremental) 방식이 필수적이다.20
Voxblox: TSDF로부터 ESDF 점진적 구축
로보틱스 분야에서 널리 사용되는 점진적 ESDF 생성 프레임워크로 ‘Voxblox’가 있다.23 Voxblox의 핵심 전략은 센서 데이터를 직접 ESDF로 변환하는 것이 아니라, 중간 표현으로 TSDF(Truncated Signed Distance Field)를 사용하는 것이다.20
이러한 TSDF-ESDF 파이프라인은 ‘센서 데이터의 물리적 특성’과 ‘응용 프로그램의 요구사항’ 사이의 간극을 메우는 매우 실용적이고 영리한 공학적 해결책이다. 그 배경을 살펴보면 다음과 같다.
이 업데이트 과정은 파면 전파(Wavefront Propagation) 원리를 기반으로 하며, 두 개의 우선순위 큐(priority queue)를 사용하여 효율적으로 관리된다.20
lower 큐: 새로운 장애물이 관측되거나 기존 경로보다 더 짧은 경로가 발견되어 거리 값이 ‘작아져야’ 하는 복셀들을 관리한다. 이 큐의 복셀들은 주변 이웃들에게 더 짧은 거리 정보를 전파하는 파면의 시작점이 된다.raise 큐: 기존 장애물이 사라져 거리 값이 ‘커져야’ 하는 복셀들을 관리한다. 이 복셀에 의존하던 주변 복셀들은 이제 최단 거리 정보를 잃었으므로, 재계산이 필요함을 알리는 역할을 한다.Voxblox의 점진적 업데이트 알고리즘은 다음과 같이 요약할 수 있다 20:
raise 또는 lower 큐에 삽입한다.raise 전파: 먼저 raise 큐를 처리한다. 큐에서 복셀을 꺼내 거리 값을 무한대로 설정하고, 이 복셀을 최단 거리 경로의 부모로 삼고 있던 이웃들을 재귀적으로 raise 큐에 추가한다. 이를 통해 유효하지 않게 된 거리 정보를 맵에서 제거한다.lower 전파: raise 큐가 비워지면 lower 큐를 처리한다. 큐에서 복셀을 꺼내, 26-방향 이웃(3D 그리드에서 인접한 모든 복셀)을 확인한다. 만약 현재 복셀을 통해 이웃으로 가는 경로가 이웃의 기존 최단 거리보다 짧다면, 이웃의 거리 값을 갱신하고 lower 큐에 삽입한다. 이 과정이 큐가 빌 때까지 반복되면서 새로운 최단 거리 정보가 파도처럼 퍼져나간다.이러한 점진적 방식은 전체 맵이 아닌, 변경이 발생한 국소적인 영역에만 계산을 집중함으로써 실시간 동적 환경에서의 ESDF 유지를 가능하게 한다.
| 알고리즘 (Algorithm) | 계산 복잡도 (Complexity) | 정확도 (Accuracy) | 병렬성 (Parallelism) | 입력 데이터 (Input Data) | 주요 특징 (Key Features) | 관련 자료 |
|---|---|---|---|---|---|---|
| Marching Parabolas | O(N) (N=픽셀 수) | 정확함 (Exact) | 제한적 (행/열 단위) | 이진 그리드 | CPU 친화적, 분리 가능한 필터 원리 | 10 |
| Fast Marching Method | O(NlogN) | 근사/정확 | 제한적 (우선순위 큐) | 이진 그리드 | 파면 전파 기반, 아이코날 방정식 풀이 | 7 |
| Jump Flooding | O(logD) 패스 (D=최대 거리) | 근사 (Approximation) | 매우 높음 (Massively Parallel) | 이진 그리드 | GPU에 매우 적합, 간단한 구현 | (일반적인 GPU 기법) |
| Scan Conversion | O(M⋅V) (M=프리미티브, V=복셀) | 정확함 (Exact) | 높음 (프리미티브 단위) | 다각형 메시 | GPU 가속, 좁은 밴드에서 작동 | 1 |
| Voxblox (Incremental) | 업데이트 영역에 비례 | 정확함 (TSDF 오차 제외) | 중간 (멀티스레딩) | TSDF | 점진적 업데이트, 동적 환경용 | 20 |
ESDF의 풍부한 기하학적 정보와 강력한 수학적 특성은 컴퓨터 그래픽스와 로보틱스 분야에서 다양한 문제들을 해결하는 핵심적인 도구로 활용되게 하였다.
컴퓨터 그래픽스 분야에서 ESDF는 전통적인 다각형 메시 기반의 렌더링 및 시뮬레이션 패러다임을 벗어나는 새로운 가능성을 열었다.
실시간 렌더링: 레이마칭 (Ray Marching)
레이마칭은 SDF로 정의된 암시적 표면을 렌더링하는 대표적인 기법이다.9 기존의 레이 트레이싱(ray tracing)이 광선과 객체의 교차점을 해석적으로 계산하는 반면, 레이마칭은 광선을 따라 일정한 간격으로 전진하며 표면을 찾아 나가는 방식이다.
이 과정에서 ESDF는 스피어 트레이싱(Sphere Tracing)이라는 최적화 기법을 통해 비약적인 효율성 향상을 가져온다. 그 원리는 다음과 같다 9:
이러한 레이마칭 기법은 복잡한 프랙탈(fractal) 구조, 무한히 반복되는 절차적(procedural) 형상, 또는 CSG(Constructive Solid Geometry) 연산으로 정의된 객체들을 다각형 메시로 변환하는 어려운 과정 없이 직접 렌더링할 수 있게 해준다.9
기타 응용
로보틱스 분야에서 ESDF는 로봇이 주변 환경을 인식하고, 안전하게 움직이기 위한 계획을 수립하는 데 있어 핵심적인 역할을 수행한다.
경로 계획 및 충돌 회피
현대 로보틱스의 경로 계획(path planning)은 단순히 시작점에서 목표점까지의 경로를 찾는 것을 넘어, 경로의 부드러움, 에너지 효율성, 안전성 등을 모두 고려하는 최적화 문제로 발전했다. CHOMP, TrajOpt, GPMP2와 같은 최적화 기반 플래너들은 경로를 표현하는 수많은 점들에 대해 비용 함수(cost function)와 그 그래디언트(gradient)를 반복적으로 계산하여 경로를 점차 개선해 나간다.22
ESDF는 이러한 최적화 기반 플래너들에게 완벽한 기반을 제공한다.
SLAM (Simultaneous Localization and Mapping)
SLAM은 로봇이 미지의 환경을 탐색하면서 자신의 위치를 추정하고 동시에 지도를 작성하는 기술이다. 2D-SDF-SLAM과 같은 연구에서는 기존의 점유 격자 지도 대신 SDF를 맵 표현으로 사용하여, 복셀 크기보다 더 높은 아-복셀(sub-voxel) 정밀도로 환경을 모델링할 수 있음을 보였다. 이를 통해 로봇의 위치 추정 정확도를 크게 향상시켰다.19 또한, SDF의 미분 가능성 덕분에 스캔 정합(scan matching) 과정에서 Gauss-Newton과 같은 효율적인 비선형 최적화 기법을 직접 적용할 수 있어, 기존의 브루트포스 방식보다 더 빠르고 정확한 정합이 가능하다.
로봇 및 환경 모델링
ESDF는 외부 환경뿐만 아니라 로봇 자체의 기하학적 구조를 표현하는 데에도 사용될 수 있다. 로봇의 각 링크(link)를 개별적인 SDF로 모델링하고, 이를 로봇의 관절 각도(joint angles)에 따라 실시간으로 변환 및 합성하면, 로봇의 자기 충돌(self-collision)이나 복잡한 환경과의 상호작용을 매우 효율적으로 검사할 수 있다.11 또한, CBF(Control Barrier Function)와 같은 안전 보장 제어 기법에서는, 복잡한 형태의 수많은 장애물들을 ESDF라는 단일 연속 함수로 표현하여 안전 제약 조건을 단순화하고 실시간 제어기 설계에 활용할 수 있다.28
ESDF는 그 자체로도 강력한 표현 방식이지만, 그 가치와 특성은 다른 유사한 표현 방식과의 비교를 통해 더욱 명확해진다. 특히 로보틱스 분야에서 ESDF와 함께 자주 언급되는 TSDF와의 차이점을 이해하고, 최근 3D 딥러닝 분야에서 등장한 신경망 기반 SDF의 혁신을 살펴보는 것은 매우 중요하다.
ESDF와 TSDF는 둘 다 부호화된 거리 필드라는 점에서 공통점을 가지지만, 거리 측정 방식과 데이터 저장 전략에서 결정적인 차이를 보인다.
핵심 차이점
트레이드오프와 사용 시나리오
이러한 차이점들은 각 표현 방식이 특정 응용에 더 적합하게 만드는 트레이드오프로 이어진다.
| 특성 (Characteristic) | Euclidean Signed Distance Field (ESDF) | Truncated Signed Distance Field (TSDF) |
|---|---|---|
| 거리 메트릭 | 실제 유클리드 거리 (True Euclidean) | 센서 광선 기준 투영 거리 (Projective) |
| 정확도 | 높음, 기하학적으로 정확함 | 근사치, 곡면에서 오차 발생 가능 |
| 절단 (Truncation) | 없음 (원칙적) | 있음 (표면 주변 좁은 밴드) |
| 주요 생성원 | 점유 그리드, TSDF, 메시 | 깊이 센서 데이터 (RGB-D) |
| 계산 효율성 | 상대적으로 높음 (배치 기준) | 매우 높음 (실시간 융합) |
| 메모리 사용량 | 높음 (절단 없을 시) | 낮음 (절단으로 인해) |
| 주요 응용 분야 | 경로 계획, 충돌 회피, 최적화 | 실시간 3D 재구성, SLAM 매핑 |
| 관련 자료 | 22 | 20 |
최근 몇 년간 3D 비전 및 그래픽스 분야는 딥러닝 기술의 도입으로 급격한 변화를 겪고 있으며, SDF 표현 방식 역시 예외는 아니다. 신경망을 이용한 새로운 SDF 패러다임이 등장하며 기존 방식의 한계를 극복하고 새로운 가능성을 열고 있다.
기존 그리드 기반 SDF의 한계
고전적인 ESDF/TSDF는 복셀 그리드(voxel grid)라는 이산적인 데이터 구조에 기반한다. 이는 다음과 같은 근본적인 한계를 가진다.
DeepSDF의 혁신
2019년에 발표된 DeepSDF는 이러한 한계를 극복하기 위해 신경망, 특히 다층 퍼셉트론(Multi-Layer Perceptron, MLP)을 사용하여 SDF를 표현하는 혁신적인 방법을 제안했다.2 DeepSDF의 등장은 3D 기하학을 다루는 방식에 있어 근본적인 패러다임 전환을 의미한다. 이는 3D 기하학을 단순히 ‘측정하고 재구성하는(measuring and reconstructing)’ 대상에서 ‘이해하고 생성하며 편집하는(understanding, generating, and editing)’ 대상으로 바꾸었기 때문이다.
DeepSDF의 핵심적인 기술적 특징은 다음과 같다 5:
최신 연구 동향
DeepSDF 이후, 신경망 기반 SDF 연구는 더욱 활발해지고 있다.
| 기준 (Criterion) | 고전적 SDF (ESDF/TSDF) | 신경망 SDF (예: DeepSDF) |
|---|---|---|
| 표현 방식 | 이산적 (Discrete, Voxel Grid) | 연속적 (Continuous, MLP) |
| 표현 대상 | 단일 인스턴스 (Single Instance) | 형상 클래스 (Class of Shapes) |
| 메모리 | 해상도에 비례 (고) | 네트워크 파라미터 수에 비례 (저) |
| 주요 기능 | 3D 재구성 (Reconstruction) | 재구성, 생성(Generation), 보간(Interpolation), 완성(Completion) |
| 일반화 능력 | 없음 | 높음 (학습된 클래스 내에서) |
| 데이터 요구사항 | 3D 스캔 데이터 (메시, 포인트 클라우드) | 대규모 3D 형상 데이터셋 |
| 핵심 기술 | 거리 변환, 파면 전파 | 심층 학습 (Auto-Decoder, Latent Vector) |
| 관련 자료 | 10 | 4 |
본 보고서를 통해 유클리드 부호 거리 필드(ESDF)가 단순한 거리 정보를 담은 데이터 구조를 넘어, 풍부한 기하학적 정보를 내포한 강력한 암시적 표면 표현 방식임을 확인하였다. ESDF의 핵심 가치는 그 연속성과 미분 가능성에 있다. 이 두 가지 특성은 ESDF가 단순한 점유 여부를 넘어, 표면까지의 정확한 거리와 표면의 방향(법선 벡터) 정보를 공간 전체에 걸쳐 제공하게 만든다.
이러한 특성 덕분에 ESDF는 다양한 분야에서 근본적인 문제 해결 도구로 자리매김했다. 컴퓨터 그래픽스에서는 레이마칭과 같은 효율적인 실시간 렌더링 기법을 가능하게 했고, 물리 시뮬레이션에서는 정밀한 충돌 감지의 기반이 되었다. 특히 로보틱스 분야에서 ESDF의 가치는 더욱 두드러진다. 최적화 기반 경로 계획 알고리즘에 필수적인 연속적인 비용 함수와 그래디언트를 제공함으로써, 로봇이 복잡하고 동적인 환경에서도 안전하고 효율적으로 움직일 수 있는 길을 열었다. ESDF의 그래디언트가 인식(perception)과 계획(planning) 사이의 간극을 메우는 핵심적인 역할을 수행한 것이다.
ESDF와 그 파생 기술들은 앞으로도 계속해서 발전하며 새로운 가능성을 탐색할 것으로 전망된다.
결론적으로, ESDF는 앞으로도 로보틱스의 실시간 제어 및 계획 분야에서 그 중요성을 유지할 것이다. 동시에, DeepSDF로 시작된 신경망 기반의 접근법은 3D 데이터를 이해하고 생성하는 방식에 근본적인 변화를 가져오며, 고수준의 의미론적 이해와 결합하여 더욱 지능적인 3D 인식 및 상호작용의 새로운 시대를 열 것으로 전망된다.
| Difference Between L1/Manhattan and L2/Euclidean Distance | by DataScienceSphere, accessed July 31, 2025, https://medium.com/@datasciencejourney100_83560/difference-between-l1-manhattan-and-l2-euclidean-distance-c70b5da25fe0 |
| Computing the Signed Distance Field | by TKMI-kyon - Medium, accessed July 31, 2025, https://tkmikyon.medium.com/computing-the-signed-distance-field-a1fa9ba2fc7d |
| Open3D: How does volumetric integration work? | by Aashutosh …, accessed July 31, 2025, https://aashutosh-py.medium.com/open3d-how-does-volumetric-integration-work-b41d3c14d4e6 |