3차원 포인트 클라우드 정합(Point Cloud Registration)은 서로 다른 시점이나 센서로부터 획득된 두 개 이상의 3D 포인트 클라우드 데이터를 하나의 일관된 좌표계로 정렬하는 근본적인 과정이다.1 이 기술은 3D 데이터를 활용하는 수많은 상위 레벨 태스크, 예를 들어 객체 인식, 장면 이해, 환경 모델링 등을 가능하게 하는 기반 기술로서 학술 및 산업계 전반에 걸쳐 지대한 중요성을 가진다. 자율주행 자동차의 LiDAR 센서가 생성하는 데이터를 이용한 동시적 위치 추정 및 지도 작성(SLAM), 로봇이 주변 환경을 인식하고 상호작용하는 로보틱스, 여러 스캔 데이터를 병합하여 완전한 모델을 만드는 3D 재구성, 그리고 가상 객체를 현실 세계에 정밀하게 배치하는 증강 현실(AR) 등은 포인트 클라우드 정합 기술에 깊이 의존하는 대표적인 응용 분야다.2
그러나 포인트 클라우드 정합은 본질적으로 여러 난제를 내포한다. 센서로부터 발생하는 측정 노이즈, 데이터에 포함된 무관한 점들인 아웃라이어(outliers), 스캔 위치에 따른 비균일한 포인트 밀도 등은 정합의 정확성을 저해하는 주요 요인이다. 이 중에서도 특히 두 포인트 클라우드 간에 겹치는 영역이 적은 저겹침(low-overlap) 시나리오는 신뢰할 수 있는 대응점(correspondence)을 찾는 것을 극도로 어렵게 만들어, 강건한(robust) 정합 알고리즘 개발에 있어 가장 큰 도전 과제로 남아있다.2
‘GeoTransformer’라는 명칭은 인공지능 연구 분야의 광범위한 트렌드를 반영하듯, 서로 다른 도메인에서 독립적으로 개발된 여러 모델에 의해 사용되고 있어 잠재적인 혼동을 야기한다. 이러한 명칭의 충돌은 특정 기술을 처음 접하는 연구자들에게 상당한 혼란을 줄 수 있으므로, 기술 보고서는 이러한 모호성을 명확히 해소하는 중요한 역할을 수행해야 한다.
본 보고서에서 심층적으로 분석할 핵심 대상은 Zheng Qin 등이 컴퓨터 비전 분야의 최고 학회인 CVPR 2022에서 발표한 “Geometric Transformer for Fast and Robust Point Cloud Registration” 연구다.6 이 모델은 3D 포인트 클라우드 정합 문제에 특화되어 있으며, ‘GeoTransformer’라는 약칭으로 학계에 널리 알려져 있다.1
이와는 별개로 존재하는 동명의 주요 모델들은 다음과 같다. 첫째, 도시 예측(Urban Forecasting) 분야의 GeoTransformer는 고차원 지역 임베딩과 동적 공간 모델링을 결합하여 GDP나 차량 공유 수요와 같은 사회경제적 지표를 예측한다.8 이 모델의 핵심은 지리적 통계학에 기반한 ‘Geospatial Attention Mechanism’으로, 본 보고서에서 다루는 포인트 클라우드 정합 모델과는 목표, 데이터 형태, 아키텍처 측면에서 근본적인 차이가 있다.9 둘째, 자연어 처리(NLP) 분야에서는 지리적 위치 정보를 ‘Geotokens’라는 형태로 토큰화하고, 이를 구면 좌표계에 맞게 조정된 위치 인코딩 방식으로 처리하는 “Geotokens and Geotransformers” 연구가 존재한다.11
따라서 본 보고서는 위와 같은 혼동을 방지하고, 3D 컴퓨터 비전 분야에서 가장 큰 영향력을 발휘하고 있는 CVPR 2022의 포인트 클라우드 정합 모델에 대한 명확하고 깊이 있는 분석을 제공하는 데 그 범위를 한정한다.
GeoTransformer는 기존 포인트 클라우드 정합 방법론의 한계를 극복하기 위한 몇 가지 혁신적인 기여를 통해 새로운 패러다임을 제시했다.
첫째, Keypoint-free 접근법을 계승하고 발전시켰다. 저겹침 시나리오에서는 반복적으로 검출 가능한 안정적인 키포인트(keypoint)를 찾기 어렵다는 문제의식 하에, GeoTransformer는 포인트 클라우드를 다운샘플링하여 생성된 ‘슈퍼포인트(superpoints)’라는 추상화된 단위 간의 대응 관계를 찾는 keypoint-free 패러다임을 채택했다.5 이는 정합 문제를 개별 포인트의 엄격한 매칭에서 슈퍼포인트 주변 패치(patch)의 느슨한 겹침을 찾는 문제로 완화시켜 저겹침 환경에서의 강건성을 높였다.
둘째, RANSAC-free를 통한 속도 혁신을 이루었다. 전통적인 정합 파이프라인은 부정확한 대응점(outliers)을 걸러내기 위해 RANSAC(Random Sample Consensus)과 같은 강건한 추정기에 크게 의존했다. 그러나 RANSAC은 반복적인 샘플링과 가설 검증 과정으로 인해 계산 비용이 매우 높다. GeoTransformer는 모델 아키텍처 자체에 기하학적 구조를 명시적으로 인코딩함으로써 매우 높은 인라이어 비율(inlier ratio)을 가진 대응점을 생성해낸다. 이처럼 대응점의 품질이 뛰어나기 때문에 RANSAC과 같은 후처리 과정 없이도 정확한 변환 행렬 추정이 가능해졌고, 이는 결과적으로 전체 정합 속도를 100배 이상 가속하는 혁신을 가져왔다.6 이는 통계적 강건성에 의존하던 기존 패러다임에서, 아키텍처 자체의 설계를 통해 강건성을 확보하는 방향으로의 전환을 의미한다.
셋째, 기하학적 불변성(Geometric Invariance)을 도입했다. 기존 Transformer 기반 모델들은 점의 절대 좌표에 기반한 위치 임베딩을 사용했기 때문에, 입력 포인트 클라우드의 회전이나 이동과 같은 강체 변환(rigid transformation)에 민감한 특징을 학습하는 경향이 있었다.1 GeoTransformer는 이러한 문제를 해결하기 위해 강체 변환에 대해 불변(invariant)인 기하학적 속성, 즉 두 점 사이의 거리(pair-wise distances)와 세 점이 이루는 각도(triplet-wise angles)만을 인코딩하여 Transformer의 어텐션 메커니즘에 주입했다. 이로써 모델은 포인트 클라우드가 어떤 임의의 자세(pose)로 주어지더라도 일관되고 강건한 기하학적 특징을 학습할 수 있게 되었다.1
GeoTransformer는 복잡한 포인트 클라우드 정합 문제를 여러 단계로 나누어 해결하는 ‘Coarse-to-Fine’ 계층적 접근법을 채택하고 있다.7 이러한 구조는 계산 효율성과 정합 정확도 사이의 균형을 효과적으로 달성하기 위한 전략적 선택이다. 전체 데이터 처리 흐름은 다음과 같은 단계로 구성된다.
이처럼 문제를 추상화된 슈퍼포인트 레벨에서 먼저 해결하고, 그 결과를 바탕으로 세부적인 포인트 레벨로 정제해 나가는 ‘분할 정복(divide and conquer)’ 전략은 전체 탐색 공간을 크게 줄여 계산 효율성을 높이는 동시에, 각 단계가 더 제한되고 단순화된 문제를 풀게 함으로써 최종적인 정합 정확도를 향상시킨다.
GeoTransformer의 파이프라인 첫 단계를 담당하는 특징 추출기는 KPConv-FPN 아키텍처를 기반으로 한다. 이는 3D 포인트 클라우드의 고유한 특성을 효과적으로 처리하기 위해 설계되었다.
KPConv (Kernel Point Convolution)는 포인트 클라우드와 같이 비정형적이고 순서가 없는 데이터에 직접 적용할 수 있는 3D 컨볼루션 연산이다.7 기존의 그리드 기반 CNN과 달리, KPConv는 소수의 커널 포인트(kernel points)를 정의하고, 이 커널 포인트들과 주변 점들 간의 상대적 위치에 따라 가중치를 학습한다. 이러한 유연성 덕분에 KPConv는 밀도 변화에 강건하고 복잡한 기하학적 구조로부터 유의미한 특징을 효과적으로 추출할 수 있다.
FPN (Feature Pyramid Network)은 다양한 해상도의 특징 맵을 생성하고 이를 결합하는 구조다. GeoTransformer에서는 KPConv와 FPN을 결합하여 다중 스케일의 특징을 동시에 추출한다. 이를 통해 가장 조밀한 초기 레벨의 포인트들(dense points)과 가장 희소한 최종 레벨의 슈퍼포인트들(superpoints)이 각각의 스케일에 맞는 풍부한 컨텍스트 정보를 가진 특징 벡터를 갖게 된다.7 이 구조는 데이터셋의 규모에 따라 유연하게 조정되는데, 예를 들어 상대적으로 작은 실내 장면 데이터셋인 3DMatch에서는 4단계 백본을 사용하는 반면, 훨씬 크고 복잡한 실외 LiDAR 데이터셋인 KITTI에서는 5단계 백본을 사용하여 더 넓은 범위의 컨텍스트를 포착한다.14
GeoTransformer의 가장 핵심적인 혁신은 Transformer의 어텐션 메커니즘에 강체 변환 불변(rigid-transformation-invariant) 기하학적 정보를 명시적으로 주입하는 ‘기하학적 구조 임베딩’에 있다. 이는 “점들이 공간상의 어디에 있는가?”라는 절대적 위치 정보 대신, “점들이 서로 어떻게 관계를 맺고 있는가?”라는 상대적 구조 정보에 집중하도록 모델을 유도한다. 표준 Transformer가 사용하는 좌표 기반 위치 임베딩은 입력 데이터의 회전이나 이동에 따라 그 값이 변하기 때문에 정합 문제에 본질적으로 부적합하다.1 GeoTransformer는 이 문제를 해결하기 위해 다음과 같은 두 가지 불변 기하학적 속성을 인코딩한다.
쌍 거리 임베딩 (Pair-wise Distance Embedding): 두 슈퍼포인트 $\hat{p}i$와 $\hat{p}_j$ 사이의 유클리드 거리 $\rho{i,j} = |\hat{p}i - \hat{p}_j|_2$는 강체 변환에 불변이다. 이 스칼라 값을 Transformer가 처리할 수 있는 고차원 벡터로 변환하기 위해 sinusoidal 함수가 사용된다. 이는 원래 Transformer의 위치 인코딩에서 영감을 받은 방식이다. 거리 임베딩 $r^D{i,j}$는 다음과 같이 계산된다.14 \(\begin{cases} r^D_{i,j,2k} = \sin\left(\frac{\rho_{i,j}}{\sigma_d \cdot 10000^{2k/d_t}}\right) \\ r^D_{i,j,2k+1} = \cos\left(\frac{\rho_{i,j}}{\sigma_d \cdot 10000^{2k/d_t}}\right) \end{cases}\) 여기서 $d_t$는 임베딩 벡터의 차원이며, $\sigma_d$는 거리 변화에 대한 민감도를 조절하는 온도(temperature) 하이퍼파라미터다. 이 값은 데이터셋의 스케일에 따라 조정되는데, 실내 3DMatch 데이터셋에서는 0.2m, 대규모 실외 KITTI 데이터셋에서는 4.8m로 설정되어 각 환경의 기하학적 스케일에 맞게 임베딩을 조정한다.14
삼중항 각도 임베딩 (Triplet-wise Angular Embedding): 두 점 사이의 거리를 넘어 더 고차원적인 구조 정보를 포착하기 위해, 세 개의 슈퍼포인트($\hat{p}_i, \hat{p}_j, \hat{p}_k$)가 이루는 각도 $\alpha$ 또한 인코딩된다.1 각도 역시 강체 변환에 불변인 속성이며, 이를 통해 모델은 단순한 거리 관계를 넘어선 삼각형 구조와 같은 지역적 형태 정보를 학습할 수 있다. 각도 임베딩은 거리 임베딩과 동일한 형태의 sinusoidal 함수를 사용하여 계산되며, 각도 민감도를 조절하는 $\sigma_a$는 두 데이터셋 모두에서 15°로 설정되었다.14
이러한 기하학적 임베딩은 모델에 강력한 관계적 편향(relational bias)을 주입한다. 즉, 모델이 장면의 내재적이고 불변하는 기하학적 골격을 학습하도록 강제하며, 이는 특히 정보가 부족한 저겹침 시나리오에서 모델이 강건하게 동작하는 핵심적인 이유가 된다.
기하학적 구조 정보로 무장한 슈퍼포인트 특징들은 슈퍼포인트 정합 모듈, 즉 Geometric Transformer를 통해 처리된다. 이 모듈은 두 가지 종류의 어텐션 블록을 교차(interleave)하여 쌓은 구조를 가진다. 이는 각 포인트 클라우드 내부의 컨텍스트를 강화하는 단계와 두 포인트 클라우드 간의 정보를 교환하는 단계를 분리하여 효과적인 정보 흐름을 만들기 위함이다.14
기하학적 자기-어텐션 (Geometric Self-Attention): 이 모듈은 각 포인트 클라우드에 독립적으로 적용되어 내부의 슈퍼포인트 특징들을 정제하고 강화한다. 표준 자기-어텐션과 마찬가지로 각 슈퍼포인트는 다른 모든 슈퍼포인트와의 관계를 통해 자신의 특징 표현을 업데이트한다. GeoTransformer의 핵심은 어텐션 가중치를 계산할 때, 앞서 생성된 쌍 거리 및 삼중항 각도 임베딩을 어텐션 편향(attention bias)으로 추가한다는 점이다. 이를 통해 기하학적으로 가깝거나 구조적으로 관련된 슈퍼포인트들 사이에 더 높은 어텐션 점수가 부여되어, 모델이 각 슈퍼포인트의 지역적 및 전역적 기하학적 컨텍스트를 풍부하게 학습하게 된다.1
특징 기반 교차-어텐션 (Feature-based Cross-Attention): 자기-어텐션을 통해 강화된 두 포인트 클라우드의 특징들은 교차-어텐션 모듈에서 상호작용한다. 예를 들어, 소스 포인트 클라우드의 슈퍼포인트 특징들이 Query로 사용되고, 타겟 포인트 클라우드의 특징들이 Key와 Value로 사용된다. 이를 통해 소스의 각 슈퍼포인트는 타겟의 모든 슈퍼포인트들을 ‘살펴보고’ 자신과 가장 관련성이 높은 정보를 가져와 특징을 업데이트한다. 이 과정은 두 포인트 클라우드 간의 잠재적인 대응 관계를 탐색하고, 서로의 정보를 바탕으로 특징 표현을 상호 보완적으로 정제하는 역할을 한다.14 이 두 어텐션 모듈은 여러 번 번갈아 가며 적용되어, 점진적으로 더 정교하고 신뢰도 높은 특징 표현을 구축한다.
Geometric Transformer를 통해 얻어진 슈퍼포인트 레벨의 희소한 대응 관계는 최종적인 정밀 정합을 위해 조밀한 포인트 레벨로 확장되어야 한다. 이 역할을 포인트 정합 모듈이 담당하며, 최적 수송(Optimal Transport) 이론을 기반으로 동작한다.7
대응 관계로 예측된 한 쌍의 슈퍼포인트(소스의 $\hat{p}_i$, 타겟의 $\hat{p}_j$)가 주어지면, 각 슈퍼포인트 주변의 로컬 패치(patch)에 속하는 실제 포인트들 간의 매칭 문제가 정의된다. 이 문제는 한 분포(소스 패치의 포인트들)를 다른 분포(타겟 패치의 포인트들)로 옮기는 데 필요한 최소 비용을 찾는 최적 수송 문제로 공식화될 수 있다. 여기서 비용은 두 포인트의 특징 벡터 간의 유사도로 정의된다.
이 문제를 해결하기 위해, 미분 가능(differentiable)하고 효율적인 Sinkhorn 알고리즘이 사용된다.3 Sinkhorn 알고리즘은 반복적인 행과 열의 정규화를 통해 최적 수송 문제의 근사해인 소프트 할당 행렬(soft assignment matrix)을 계산한다. 이 행렬의 각 원소는 소스 패치의 특정 포인트가 타겟 패치의 특정 포인트와 매칭될 확률을 나타낸다. 이 과정을 통해 슈퍼포인트 레벨의 단일 대응 관계가 수십 개의 조밀한 포인트 대응 관계로 정제되고 확장된다.
GeoTransformer의 학습을 지도하는 손실 함수로는 ‘Overlap-aware Circle Loss’가 사용된다. 이는 표준적인 분류 손실인 Cross-Entropy Loss의 한계를 극복하기 위해 고안되었다.1
하나의 소스 슈퍼포인트는 여러 개의 타겟 슈퍼포인트와 겹칠 수 있으므로, 이 문제는 다중 정답(multi-label) 분류 문제로 볼 수 있다. 이러한 상황에서 Cross-Entropy 손실은 이미 높은 신뢰도(confidence)를 보이는 정답 쌍에 대해서는 그래디언트를 줄여 학습을 억제하는 경향이 있다. 이는 모델이 가장 확실한 하나의 대응 관계에만 집중하고 다른 유효한 대응 관계들을 놓치게 만들 수 있다.14
Circle Loss는 이러한 문제를 해결하기 위해 메트릭 러닝(metric learning) 관점에서 접근한다.1 이 손실 함수는 정답 쌍(positive pairs)의 유사도는 높이고 오답 쌍(negative pairs)의 유사도는 낮추도록 직접적으로 최적화한다. 중요한 것은 각 정답 쌍과 오답 쌍이 독립적으로 손실에 기여하도록 설계되어, 하나의 정답 쌍이 다른 정답 쌍의 학습을 방해하지 않는다는 점이다.
여기에 Overlap-aware 가중치 개념이 추가된다. 두 슈퍼포인트의 로컬 패치가 실제로 겹치는 면적이 클수록 더 신뢰할 수 있는 대응 관계이므로, 이 겹침 비율을 손실 계산 시 가중치로 사용한다. 즉, 겹침이 많은 중요한 대응 관계에 대해 더 큰 손실 값을 부여하여 모델이 이러한 쌍에 더 집중하도록 유도한다.1 이 두 가지 요소의 결합을 통해 GeoTransformer는 더 안정적이고 효과적으로 고품질의 대응 관계를 학습할 수 있다.
GeoTransformer의 성능은 다양한 시나리오를 포괄하는 표준 벤치마크 데이터셋을 통해 종합적으로 평가되었다. 각 데이터셋은 정합 알고리즘이 마주할 수 있는 서로 다른 도전 과제를 대표한다.
GeoTransformer는 기존의 최첨단(SOTA) 모델들과의 비교를 통해 특히 어려운 저겹침 시나리오에서 압도적인 성능 향상을 입증했다. 아래 표는 3DMatch와 3DLoMatch 벤치마크에서의 주요 성능 지표를 요약한 것이다.
| 모델 (Method) | 벤치마크 (Benchmark) | 정합 재현율 (RR, %) ↑ | 인라이어 비율 (IR, %) ↑ | RANSAC 사용 여부 |
|---|---|---|---|---|
| PREDATOR 5 | 3DMatch | 97.1 | 58.5 | Yes |
| CoFiNet 12 | 3DMatch | 96.9 | 37.8 | Yes |
| GeoTransformer 5 | 3DMatch | 98.2 | 70.9 | No (Local-to-Global) |
| PREDATOR 5 | 3DLoMatch | 81.8 | 32.1 | Yes |
| CoFiNet 12 | 3DLoMatch | 82.1 | 21.3 | Yes |
| GeoTransformer 5 | 3DLoMatch | 89.1 | 62.3 | No (Local-to-Global) |
이 표에서 드러나는 가장 중요한 결과는 3DLoMatch 벤치마크에서의 성능이다. 저겹침 환경은 신뢰할 수 있는 특징을 찾기 어려워 기존 방법들이 고전하던 영역이다. GeoTransformer는 이 벤치마크에서 이전 SOTA 모델 대비 정합 재현율(RR)을 약 7%p 이상, 그리고 인라이어 비율(IR)은 무려 30%p 이상 극적으로 향상시켰다.6 이는 GeoTransformer의 기하학적 불변 특징이 정보가 희소한 상황에서도 매우 효과적으로 강건한 대응 관계를 찾아냄을 명확히 입증하는 결과다. 3DLoMatch에서의 이러한 압도적인 성능 향상은 GeoTransformer의 아키텍처 철학, 즉 변환 불변의 기하학적 구조를 학습하는 것이 저겹침 문제 해결의 핵심이라는 주장을 강력하게 뒷받침한다.
상대적으로 쉬운 3DMatch 벤치마크에서도 GeoTransformer는 기존 모델들을 능가하는 SOTA 성능을 달성하며, 높은 겹침 시나리오에서도 모델의 효과가 유효함을 보여주었다.5
GeoTransformer의 가장 큰 실용적 장점 중 하나는 RANSAC을 사용하지 않는다는 점이다. 이는 단순히 하나의 단계를 생략하는 것을 넘어, 정합 파이프라인의 근본적인 효율성과 안정성을 개선한다.
정량적 수치 외에도, 정성적 결과는 GeoTransformer가 어떻게 기하학적 컨텍스트를 이해하는지를 직관적으로 보여준다. 공개된 논문의 시각화 자료를 분석하면, 대칭적인 구조를 가진 객체(예: 의자 등받이의 양쪽 모서리)에서 기존 방법들이 혼동을 일으켜 잘못된 매칭을 생성하는 반면, GeoTransformer는 전체적인 공간적 일관성(spatial consistency)을 고려하여 올바른 대응 관계를 찾아내는 것을 확인할 수 있다.1 이는 모델이 개별 점의 지역적 특징뿐만 아니라, 점들이 모여 형성하는 더 큰 구조 내에서의 상대적 위치와 관계를 이해하고 있음을 시사한다.
GeoTransformer는 발표 이후 3D 포인트 클라우드 정합 분야에서 중요한 이정표로 자리 잡았으며, 수많은 후속 연구의 기반이 되거나 비교 대상으로 활용되었다. 이러한 연구들은 GeoTransformer의 성능을 더욱 향상시키려는 시도와, 그 내재적 한계를 극복하려는 시도로 나눌 수 있다.
GeoTransformer의 높은 정확도, 빠른 속도, 그리고 저겹침 환경에서의 강건성은 다양한 산업 분야에서 실질적인 응용 가능성을 열어준다.
GeoTransformer는 3D 포인트 클라우드 정합 분야에 몇 가지 중대한 기여를 남긴 이정표적인 연구로 평가된다.
첫째, 강체 변환에 불변인 기하학적 특징(쌍 거리, 삼중항 각도)을 Transformer 아키텍처에 성공적으로 통합하여, 딥러닝 모델이 데이터의 내재적 기하학 구조를 학습할 수 있는 새로운 방향을 제시했다. 이는 기존의 좌표 기반 접근법이 가졌던 변환 민감성 문제를 근본적으로 해결했다.
둘째, 높은 품질의 대응점을 생성함으로써 RANSAC과 같은 통계적 후처리 과정의 필요성을 제거했다. 이는 Coarse-to-fine 파이프라인의 효율성을 극대화하여 정합 속도를 획기적으로 개선했으며, 정확도와 속도라는 두 가지 상충되는 목표를 동시에 달성하는 데 성공했다.
셋째, 정보가 부족한 저겹침(low-overlap) 시나리오에서 기존 방법론들의 성능을 극적으로 뛰어넘는 돌파구를 마련했다. 이는 GeoTransformer가 포착하는 기하학적 컨텍스트가 희소한 데이터 환경에서 특히 강력한 신호로 작용함을 입증한 결과다.
이러한 혁신적인 기여에도 불구하고, GeoTransformer는 몇 가지 내재적 한계를 가지며 이는 향후 연구의 중요한 방향을 제시한다.
결론적으로, GeoTransformer는 딥러닝 기반 포인트 클라우드 정합 연구의 흐름에 중요한 변곡점을 만들었다. 이 연구는 ‘어떻게 데이터의 내재적 특성과 기하학적 선험 지식(prior)을 효과적으로 딥러닝 아키텍처에 통합할 것인가’라는 근본적인 질문에 대한 성공적인 해답을 제시했다.
이는 3D 비전 분야의 연구가 단순히 더 깊고 큰 네트워크를 통해 데이터로부터 모든 것을 학습하려는 경향에서 벗어나, 대상 데이터가 가진 고유한 불변성, 대칭성, 구조적 특성을 모델 설계 단계에서부터 적극적으로 활용하는 방향으로 나아가는 데 중요한 영감을 제공한다. GeoTransformer가 제시한 원칙은 포인트 클라우드 정합을 넘어 다른 3D 비전 태스크에서도 데이터의 본질을 이해하고 활용하는 더 정교하고 효율적인 모델 개발을 촉진하는 기폭제가 될 것이다.
| GeoTransformer: Enhancing Urban Forecasting with Geospatial Attention Mechanisms | AI Research Paper Details - AIModels.fyi, 8월 23, 2025에 액세스, https://www.aimodels.fyi/papers/arxiv/geotransformer-enhancing-urban-forecasting-dependency-retrieval-geospatial |
| Geometric Transformer for Fast and Robust Point Cloud Registration | CVPR 2022, 8월 23, 2025에 액세스, https://www.youtube.com/watch?v=BbG4hhaLXhE |
| GeoTransformer: Fast and Robust Point Cloud Registration With Geometric Transformer | Request PDF - ResearchGate, 8월 23, 2025에 액세스, https://www.researchgate.net/publication/369394843_GeoTransformer_Fast_and_Robust_Point_Cloud_Registration_With_Geometric_Transformer |