16.7.1.3 에지(Edge) 기기용 초경량 스위트(CHACHA20-POLY1305) 선별 및 런타임 레이턴시 최적화
AES-NI 하드웨어 가속(16.7.1.2장 참조)은 데몬의 암호화 오버헤드를 부숴버리는 마법의 탄환이지만, 그 탄환은 모든 총에 장전되지 않는다.
전 세계 분산 Zenoh 메쉬망의 최전방을 지키는 존재는 수천 달러짜리 인텔 제온 프로세서가 아니다. 단가 2만 원짜리 Raspberry Pi Zero, 혹은 Zenoh-Pico 가 얹혀 돌아가는 ESP32 와 같은 극소형 초저전력(Low-Power) 마이크로컨트롤러(MCU)들이다.
이 저주받은 극소형 실리콘 조각들 안에는 AES-NI 와 같은 고급 물리 암호 회로 따윈 존재하지 않는다. 이런 장비들에게 무턱대고 “보안을 지켜라” 며 AES-256-GCM 소프트웨어 연산을 강제했다간, 보드는 불과 1초 만에 배터리를 방전하거나 웜-부트(Warm-Boot)를 일으키며 폭사한다.
본 절에서는 하드웨어 가속 칩이 소거된 완전한 황무지(Bare-metal Edge) 환경에서, TLS 암호화 오버헤드를 소프트웨어적으로 압살시켜버리는 궁극의 수학적 회피 기동, ChaCha20-Poly1305 초경량 암호 스위트 선별 런북을 갈파한다.
1. AES의 배신: 소프트웨어 환경에서의 컴퓨팅 참사
AES(Advanced Encryption Standard)는 명불허전의 산업 표준이지만, 그 내부 수학 구조는 다분히 ’하드웨어 친화적’으로 설계되었다. 즉, 전용 회로 없이 순수 소프트웨어(C/Rust 연산)만으로 거대한 갈루아 필드(Galois Field) 행렬곱 덧셈 연산을 돌리려면 엄청난 CPU 레지스터 시프트 수백 번을 무식하게 태워야 한다.
소형 드론이나 아두이노(NodeMCU) 급 장비에서 Zenoh-Pico(C언어 데몬) 로 AES를 돌리면 CPU 레이턴시는 1메가바이트당 3초라는 살인적 벽에 처박힌다. 드론 제어 패킷이 3초 지연되어 전달된다면 드론은 추락한다. AES 는 하드웨어 회로가 없을 땐 최악의 살인마로 돌변한다.
2. 모바일 기기의 구원자: ChaCha20 의 수학적 경량성 제패
이를 타파하기 위해 암호학계와 구글(Google)이 꺼내 든 병기가 바로 ChaCha20-Poly1305 스트림 암호 아키텍처다.
ChaCha20은 태생부터 “전용 하드웨어 칩이 없는 깡통 CPU 환경에서도, 아주 단순한 덧셈(Add), 회전(Rotate), XOR 세 가지 산술 명령어만으로 빛의 속도로 암호화를 해치우자(ARX 설계)” 는 극단적 실용주의 수학을 기반으로 짜였다. AES 가 버거운 멍청한 ARM Cortex-M 칩셋에서도, ChaCha20 만큼은 평문 송출 속도와 버금가는 미친 스루풋으로 바이트를 갈아마시는 경이로운 성능 역전 현상(Crossover)을 보여준다.
3. 데몬 라우팅의 Cipher Suite 협상 강제 타격 런북
아키텍트는 자신이 배포하려는 Zenoh 스웜(Swarm) 단말들의 하드웨어 파워가 저열함을 파악했다면, 즉시 보안 매니페스트(Config.json5)를 뜯어고쳐 AES 계열을 몽땅 도륙 내버리고 오직 ChaCha20 만 생존시키는 암호 스위트 폭정(Tyranny)을 발동해야 한다.
// [Zenoh Edge 깡통 장비의 ChaCha20 극한 생존 런북]
{
transport: {
link: {
tls: {
// [AES 학살령] 어두운 엣지 기기의 빈약한 CPU를 죽이지 마라!
// 상대방 관제탑 서버가 아무리 자기는 AES가 좋다고 꼬드겨도(Negotiation) 절대 넘어가면 안 된다.
// 우리는 오직 소프트웨어 연산의 빛인 ChaCha20-Poly1305 만을 고집한다!
tls_ciphers: ["TLS_CHACHA20_POLY1305_SHA256"]
}
}
}
}
이 선언문 하나로 인해 일어나는 나비효과는 거대하다. 클라우드의 강력한 AWS 100코어 라우터와 빈민촌의 만 원짜리 소형 로봇 보드가 만났을 때, 로봇 보드는 “내가 AES 회로가 없으니 죽기 싫으면 무조건 ChaCha20으로 통신하자“고 클라우드의 멱살을 잡고 협상(Cipher Prioritization)을 강제한다.
결과적으로 클라우드와 엣지 양단 간의 TLS 보안 터널은 극도로 가벼운 산술 연산 스레드로 치환된다. 보안(Confidentiality)과 무결성(Integrity) 영역에서 AES에 한 치 꿀리지 않는 강력한 수준을 사수하면서도, 암호 코어 부재로 인한 엣지 CPU 파열(Deadlock)과 로보틱스 제어 지터(Jitter) 지연을 한 번에 증발시켜 버리는 것이다. 극빈 인프라스트럭처에서 최고의 시스템 스루풋을 쥐어짜 내는 것. 암호화 수학 알고리즘의 선별(Selection)은 코딩이 아니라, 자원 분배 통치술의 피날레다.