신호 처리의 근본적인 목표 중 하나는 시간에 따라 변화하는 신호의 주파수 성분을 이해하는 것이다. 음성, 금융 시계열 데이터, 생체 신호와 같이 우리가 접하는 대부분의 실제 신호는 시간에 따라 주파수 특성이 변하는 비정상(Non-stationary) 신호의 특성을 띤다.1 예를 들어, 심전도(ECG) 신호는 안정적인 구간과 급격한 스파이크가 혼재하며, 음성 신호는 발음마다 주파수 구성이 동적으로 변한다.2 이러한 신호를 올바르게 분석하기 위해서는 어떤 주파수 성분이 존재하는지뿐만 아니라, 그 주파수 성분이 ‘언제’ 나타나는지를 동시에 파악하는 시간-주파수 분석 기법이 필수적이다.
전통적인 신호 분석의 근간을 이루는 푸리에 변환(Fourier Transform)은 신호를 시간에 무관하게 전체적으로 바라보며, 신호를 구성하는 모든 주파수 성분과 그 세기를 완벽하게 분해한다.3 그러나 이 과정에서 각 주파수 성분이 발생한 시간 정보는 완전히 소실된다. 이는 신호 전체에 걸친 평균적인 주파수 정보만을 제공하므로, 신호에 포함된 순간적인 특이점(transients), 스파이크, 또는 시간에 따른 주파수 변화를 포착할 수 없다는 본질적인 한계를 가진다.1
푸리에 변환의 시간 정보 부재 문제를 해결하기 위해 제안된 단시간 푸리에 변환(Short-Time Fourier Transform, STFT)은 신호를 일정한 길이의 여러 짧은 구간으로 나누고, 각 구간에 대해 독립적으로 푸리에 변환을 적용하는 방식이다. 하지만 STFT는 모든 주파수 성분을 분석하는 데 동일한 크기의 고정된 창(window)을 사용하기 때문에, 시간 해상도와 주파수 해상도 사이에 고정된 상충 관계(trade-off)가 발생한다.1 하이젠베르크의 불확정성 원리에 따라, 시간 해상도를 높이기 위해 창의 크기를 줄이면 주파수 해상도가 저하되고, 반대로 주파수 해상도를 높이기 위해 창의 크기를 늘리면 시간 해상도가 저하된다.3 이로 인해 저주파의 장기적인 변화와 고주파의 순간적인 변화를 동시에 정밀하게 분석하는 데 근본적인 어려움이 따른다.
웨이블릿 변환(Wavelet Transform)은 STFT의 고정된 창 대신, 분석하려는 주파수에 따라 창의 크기를 능동적으로 조절하는 가변적인 창을 사용함으로써 이러한 한계를 극복한다.1 저주파 성분(큰 스케일)을 분석할 때는 시간적으로 넓은 창을 사용하여 주파수 해상도를 높이고, 고주파 성분(작은 스케일)을 분석할 때는 시간적으로 좁은 창을 사용하여 시간 해상도를 높인다. 이와 같은 다중 해상도 분석(Multiresolution Analysis, MRA) 접근법은 신호가 가진 다양한 스케일(scale)에 걸친 특징들을 효과적으로 포착하는 새로운 분석 패러다임을 제시했다.1
웨이블릿 변환의 등장은 단순히 STFT를 개선한 기술적 진보를 넘어, 신호 분석의 철학적 전환을 의미한다. 푸리에 분석이 ‘신호에 어떤 주파수 성분이 존재하는가?’라는 전역적(global) 질문에 답하는 데 집중했다면, 웨이블릿 분석은 ‘특정 주파수 성분이 언제, 어떤 스케일로 존재하는가?’라는 더 복잡하고 국소적인(local) 질문에 답하려 한다. 푸리에 변환의 기저 함수인 사인파와 코사인파는 시간 축 전체에 무한히 걸쳐 있어 시간적 국소성이 전혀 없다.3 STFT는 이를 해결하기 위해 창을 도입했지만, 모든 주파수 현상을 동일한 ‘잣대’로 측정하려는 한계를 보였다. 반면, 웨이블릿은 기저 함수 자체를 확대하거나 축소함으로써 분석 대상에 따라 ‘잣대’를 바꾸는 유연한 접근법을 취한다.1 이는 신호를 정적이고 전체적인 대상으로 보던 관점에서, 동적이고 다층적인 구조를 가진 대상으로 보는 관점으로의 전환이며, 비정상 신호가 표준이 되는 현대 데이터 분석 환경에서 웨이블릿이 강력한 도구로 자리 잡은 근본적인 이유다.
웨이블릿 변환의 핵심은 ‘모(mother) 웨이블릿’이라 불리는 하나의 프로토타입 함수 $\psi(t)$에서 시작한다. 모 웨이블릿은 이름처럼 파동(wave)의 형태를 가지면서도, 그 영향력이 짧은 시간 내에 사라지는(let) 작은 파형(wave-like oscillation)이다.1 이 함수는 진동하며 빠르게 0으로 수렴하는 특징을 가지며, 웨이블릿 변환의 기저 함수로 사용되기 위해 특정 수학적 조건을 만족해야 한다.
이 모 웨이블릿을 스케일 파라미터 $a$ ($a > 0$)로 확대 또는 축소하고, 이동 파라미터 $b$로 시간 축을 따라 평행 이동시켜 무한한 수의 ‘딸(daughter) 웨이블릿’ $\psi_{a,b}(t)$을 생성한다.3 이 딸 웨이블릿들의 집합이 웨이블릿 변환의 기저 함수 역할을 한다. 수학적 표현은 다음과 같다. \(\psi_{a,b}(t) = \frac{1}{\sqrt{a}} \psi\left(\frac{t-b}{a}\right)\) 여기서 계수 $\frac{1}{\sqrt{a}}$는 스케일 $a$의 변화에 관계없이 모든 딸 웨이블릿의 에너지를 동일하게 유지하기 위한 정규화 항이다.8
연속 웨이블릿 변환(Continuous Wavelet Transform, CWT)은 분석하고자 하는 신호 $x(t)$와 각각의 딸 웨이블릿 $\psi_{a,b}(t)$ 사이의 내적(inner product) 또는 상관관계(correlation)를 계산하는 과정이다.4 그 결과로 얻어지는 웨이블릿 계수 $W(a,b)$는 특정 시간 위치 $b$와 특정 스케일 $a$에서 신호 $x(t)$가 해당 딸 웨이블릿과 얼마나 유사한지를 나타내는 척도가 된다. CWT의 수학적 정의는 다음과 같다. \(W(a,b) = \int_{-\infty}^{\infty} x(t) \psi_{a,b}^*(t) dt\) 여기서 $*$는 켤레 복소수(complex conjugate)를 의미한다.
모든 함수가 모 웨이블릿이 될 수 있는 것은 아니다. 변환된 신호를 다시 원래 신호로 완벽하게 재구성(reconstruction)하기 위해서는 모 웨이블릿이 ‘허용 조건(Admissibility Condition)’을 만족해야 한다. 가장 중요한 조건은 웨이블릿의 평균값이 0이어야 한다는 것, 즉 주파수 영역에서 0 주파수 성분(DC component)을 갖지 않아야 한다는 점이다.5 이는 수학적으로 다음과 같이 표현된다. \(C_{\psi} = \int_{0}^{\infty} \frac{|\hat{\psi}(\omega)|^2}{\omega} d\omega < \infty\) 여기서 $\hat{\psi}(\omega)$는 $\psi(t)$의 푸리에 변환이다. 이 조건은 $\hat{\psi}(0) = 0$임을 의미하며, 웨이블릿이 진정한 ‘파동’의 형태를 가져야 함을 보장한다.5
CWT는 스케일 $a$와 이동 $b$가 연속적인 값을 가지므로, 계산된 웨이블릿 계수들은 정보가 매우 중복된다(highly redundant).6 이는 신호 분석에는 유용할 수 있으나, 데이터 압축이나 효율적인 재구성을 위해서는 불필요한 정보가 많다. 이러한 문제를 해결하기 위해 스케일과 이동 파라미터를 이산적인 값으로 샘플링한 이산 웨이블릿 변환(Discrete Wavelet Transform, DWT)이 개발되었다.
DWT의 강력한 이론적 기반은 1980년대 말 스테판 말라(Stéphane Mallat)에 의해 정립된 다중 해상도 분석(MRA)이다.5 MRA는 신호를 서로 다른 해상도(스케일)를 가진 공간들의 중첩으로 바라보고, 신호를 점진적으로 더 낮은 해상도로 분해하는 체계적인 방법을 제공한다. MRA는 두 개의 핵심 함수, 즉 ‘스케일링 함수(Scaling Function)’
$\phi(t)$와 ‘웨이블릿 함수(Wavelet Function)’ $\psi(t)$를 사용한다. ‘부(father) 웨이블릿’이라고도 불리는 스케일링 함수는 신호의 저주파 성분, 즉 전반적인 형태를 나타내는 근사(approximation) 성분을 표현하는 데 사용된다.5
MRA 이론은 실제로 한 쌍의 디지털 필터, 즉 저역 통과 필터(low-pass filter) $h$와 고역 통과 필터(high-pass filter) $g$를 이용한 필터 뱅크(Filter Bank) 구조로 매우 효율적으로 구현된다.8 이 과정은 다음과 같다.
DWT의 필터 뱅크 구현은 웨이블릿 변환을 순수 수학 이론의 영역에서 실제 공학적 응용, 특히 디지털 신호 처리(DSP)의 영역으로 끌어온 결정적인 혁신이었다. CWT의 정의는 컴퓨터에서 직접 계산하기 불가능한 연속적인 적분 연산이다.9 초기에는 이를 단순히 샘플링하여 근사했지만, 여전히 계산량이 많고 정보 중복 문제가 남았다.6 말라의 MRA 이론은 스케일링 함수와 웨이블릿 함수가 각각 저역 및 고역 통과 필터와 직접적으로 대응됨을 증명했다. 이 발견은 ‘신호를 웨이블릿 기저와 상관시키는’ 복잡한 수학적 과정이 ‘신호를 필터로 처리하고 다운샘플링하는’ 간단한 DSP 과정과 동일함을 의미했다.8 결과적으로, 고속 웨이블릿 변환(Fast Wavelet Transform, FWT)이라 불리는 이 필터 뱅크 알고리즘 덕분에 DWT는 이미지 압축(JPEG 2000), 실시간 ECG 분석 등 계산 효율성이 중요한 수많은 응용 분야에서 핵심 기술로 자리 잡을 수 있었다.
연속 웨이블릿 변환(CWT)과 이산 웨이블릿 변환(DWT)의 가장 근본적인 차이는 분석의 기본 축이 되는 스케일(scale)과 이동(translation) 파라미터를 어떻게 이산화(discretize)하는지에 있다.13
CWT: CWT는 스케일 파라미터를 매우 미세하게 샘플링하여 시간-주파수 평면을 거의 연속적으로 채운다. 일반적으로 스케일은 2의 거듭제곱이 아닌, $2^{1/v}$와 같은 작은 밑(base)을 사용하여 지수적으로 증가시킨다. 여기서 정수 $v$는 ‘옥타브당 음성(voices per octave)’이라 불리며, 한 옥타브(주파수가 2배가 되는 구간) 사이에 얼마나 많은 중간 스케일 단계를 삽입할지를 결정한다.13
$v$값이 클수록(예: 10, 12, 32) 스케일 해상도가 높아져 더 정밀한 분석이 가능하지만, 그만큼 계산량도 급격히 증가한다. 이동 파라미터는 일반적으로 정수 단위로 이산화되어 거의 연속적인 이동을 모사한다.13
DWT: DWT는 스케일을 항상 2의 거듭제곱($2^j$, 여기서 $j$는 정수)으로 샘플링한다. 이를 다이아딕(dyadic) 스케일이라고 하며, 이는 옥타브당 음성이 항상 1임을 의미한다. 따라서 DWT는 CWT에 비해 스케일 축을 매우 거칠게(coarse) 샘플링한다.13 또한, 가장 널리 사용되는 다운샘플링 DWT에서는 이동 파라미터 역시 스케일에 비례하여 샘플링된다($2^j \cdot m$, 여기서 $m$은 정수). 즉, 스케일이 커질수록(저주파) 이동 간격도 넓어진다.13
이산화 방식의 차이는 웨이블릿 계수가 담고 있는 정보의 중복성과 계산 효율성에 직접적인 영향을 미친다.
결론적으로 CWT와 DWT는 서로 다른 목적을 위해 사용되는 상호 보완적인 도구다.
사용자는 “신호의 미세한 주파수 변화를 눈으로 보고 싶다”와 같이 정밀한 분석이 필요하고 중복성이 허용된다면 CWT를, “신호를 최소한의 데이터로 표현하고 싶다”와 같이 효율성이 중요하다면 DWT를 선택하는 논리적 의사결정 과정을 따를 수 있다.
다음 표는 CWT와 DWT의 이론적 차이점과 그로 인한 실용적 특성을 요약하여 보여준다.
| 특징 (Feature) | 연속 웨이블릿 변환 (CWT) | 이산 웨이블릿 변환 (DWT) |
|---|---|---|
| 스케일 이산화 | 미세함 (Fine). $2^{j/v}$ (옥타브당 $v$개의 음성) | 거침 (Coarse). $2^j$ (다이아딕 스케일) |
| 이동 이산화 | 일반적으로 정수 단위로 미세함 | 스케일에 비례하여 거침 ($2^j m$) |
| 정보 중복성 | 매우 높음 (Highly Redundant) | 낮거나 없음 (Non-redundant for orthogonal bases) |
| 계산 복잡도 | 높음 (High) | 낮음 (Low, Fast Wavelet Transform) |
| 주요 목적 | 신호 분석, 특징 시각화 및 해석 | 신호 분석 및 합성, 압축, 잡음 제거 |
| 대표 응용 | 시간-주파수 분석, 특이점 검출, 음향 분석 | 이미지 압축 (JPEG 2000), ECG 신호 처리, 데이터 압축 |
웨이블릿 변환의 성능과 적용 가능성은 사용되는 모 웨이블릿의 수학적 특성에 의해 크게 좌우된다. 특정 응용에 가장 적합한 웨이블릿을 선택하기 위해서는 소실 모멘트, 콤팩트 지지, 대칭성, 규칙성과 같은 핵심 특성들을 이해하는 것이 중요하다.
정의: 웨이블릿 함수 $\psi(t)$가 $N$개의 소실 모멘트를 갖는다는 것은, $k = 0, 1,…, N-1$에 대해 다음 적분 값이 0이 됨을 의미한다.17 \(\int_{-\infty}^{\infty} t^k \psi(t) dt = 0\) 이는 웨이블릿 함수가 $N-1$차 이하의 모든 다항식(polynomial)과 직교(orthogonal)함을 의미한다.17 즉, 웨이블릿은 다항식과 같은 저주파 신호 성분을 ‘보지 못한다’.
실제적 의미:
실제적 의미: 이 특성은 웨이블릿 분석이 시간적으로 완벽하게 국소화(localized)됨을 보장한다.4 콤팩트 지지를 가진 웨이블릿은 신호의 특정 시간 지점에서의 특징을 분석하는 데 매우 효과적이다. 또한, DWT를 고속 웨이블릿 변환(FWT)으로 구현할 때, 유한한 길이를 갖는 FIR(Finite Impulse Response) 필터를 사용할 수 있게 하여 계산 효율성을 크게 높이는 결정적인 역할을 한다.
실제적 의미: 대칭적인 웨이블릿에 해당하는 디지털 필터는 선형 위상(linear phase) 특성을 갖는다.19 선형 위상 필터는 필터링 과정에서 신호의 모든 주파수 성분을 동일한 시간만큼 지연시켜, 신호의 위상 왜곡(phase distortion)을 방지한다. 이는 이미지 처리에서 경계(edge)나 특징의 위치가 변하지 않도록 보존하는 데 매우 중요하다. 대표적인 Daubechies 웨이블릿은 비대칭적인 반면, Symlet, Coiflet, Biorthogonal 웨이블릿은 대칭성을 개선하기 위해 특별히 설계되었다.19
이러한 웨이블릿의 네 가지 핵심 특성 사이에는 근본적인 상충 관계(trade-off)가 존재한다. 완벽한 웨이블릿은 없으며, 특정 응용에 가장 적합한 웨이블릿을 선택하는 것은 이러한 상충 관계를 이해하고 최적의 균형점을 찾는 과정이다. 예를 들어, Daubechies 웨이블릿 계열에서 소실 모멘트의 수($N$)를 늘려 압축 효율을 높이면, 필터의 길이($2N$)가 길어져 콤팩트 지지 구간이 넓어지고 시간 국소화 능력은 저하된다.19 또한, Haar 웨이블릿을 제외하고 콤팩트 지지를 갖는 직교 웨이블릿은 완벽한 대칭이 될 수 없다. 선형 위상을 위해 대칭성을 확보하려면 직교성을 포기하고 이중 직교(Biorthogonal) 웨이블릿을 사용해야 한다.19 따라서 웨이블릿 선택은 ‘최고’를 찾는 것이 아니라 ‘최적’을 찾는 문제이며, 이 ‘No Free Lunch’ 원칙을 이해하는 것이 웨이블릿을 효과적으로 활용하는 핵심이다.
다음 표는 연구자나 엔지니어가 자신의 응용 분야에 가장 적합한 웨이블릿을 정보에 기반하여 선택할 수 있도록 주요 웨이블릿 족의 핵심 특성을 요약한 것이다.
| 웨이블릿 족 | 콤팩트 지지 | 소실 모멘트 (N) | 대칭성 | 직교성 | 주요 특징 |
|---|---|---|---|---|---|
| Haar | 예 | 1 | 예 | 예 | 가장 간단함, 불연속적 |
| Daubechies (dbN) | 예 | N | 비대칭 | 예 | 최대 소실 모멘트, 압축에 유리 |
| Symlets (symN) | 예 | N | 거의 대칭 | 예 | Daubechies의 대칭성 개선 |
| Coiflets (coifN) | 예 | N (웨이블릿), 2N (스케일링) | 거의 대칭 | 예 | 스케일링 함수도 소실 모멘트를 가짐 |
| Biorthogonal (biorNr.Nd) | 예 | 분석/합성 필터가 다름 | 예 (선형 위상 가능) | 아니오 | 대칭성과 정확한 재구성을 동시에 만족 |
| Morlet, Mexican Hat | 아니오 | - | 예 | 아니오 | CWT에서 주로 사용, 해석이 용이함 |
웨이블릿 변환은 비정상적 특성을 보이고 미세한 특징 검출이 중요한 의료 신호 및 영상 처리 분야에서 매우 강력한 도구로 활용되고 있다.5
뇌전도(EEG) 신호는 뇌의 전기적 활동을 기록한 것으로, 다양한 뇌 상태에 해당하는 여러 주파수 대역(델타, 세타, 알파, 베타, 감마)으로 구성된 복잡한 비정상 신호다. 웨이블릿 변환은 이러한 EEG 신호에서 특정 사건(예: 간질파, 유발 전위)과 관련된 시간-주파수 특징을 효과적으로 추출하는 데 널리 사용된다.20 DWT를 이용해 EEG 신호를 각 주파수 대역으로 분해하고, 각 대역의 에너지, RMS(Root Mean Square) 등의 특징을 추출하여 기계 학습 모델의 입력으로 사용함으로써 감정 분류, 수면 단계 분석, 질병 진단 등의 연구에 활용된다.20
의료 분야에서 웨이블릿의 성공은 단지 기술적 우수성 때문만이 아니라, 그 분석 결과가 임상적 ‘해석 가능성(interpretability)’을 제공하기 때문이다. 웨이블릿은 신호를 수학적으로 의미 있는 주파수 대역(예: EEG의 알파파, 베타파)과 시간적 사건(예: ECG의 QRS파)으로 분해한다. 이는 엔지니어가 추출한 특징과 의사가 진단하는 생리학적 현상 사이의 간극을 메워준다. 예를 들어, 푸리에 변환은 “환자의 심장에 어떤 주파수 성분이 있는가?”에 답하지만, 웨이블릿 변환은 “QRS파에 해당하는 주파수 성분이 이 시간 지점에서 강하게 나타났다”와 같이 시간과 주파수 정보를 결합한 직관적이고 해석 가능한 결과를 제공한다.8 이러한 해석 가능성은 웨이블릿 변환이 단순한 신호 처리 도구를 넘어, 데이터로부터 임상적으로 의미 있는 정보를 추출하고 진단 과정을 지원하는 강력한 ‘진단 보조 도구’로 자리매김하게 한 핵심 요인이다.
JPEG 2000은 1992년에 제정된 이산 코사인 변환(Discrete Cosine Transform, DCT) 기반의 기존 JPEG 표준을 대체하고 성능을 개선하기 위해 개발된 차세대 이미지 압축 표준이다.25 그 핵심 기술은 이산 웨이블릿 변환(DWT)에 기반한다.27 DWT를 통해 이미지를 여러 해상도 레벨로 분해함으로써, 이미지의 전반적인 밝기와 색상 같은 저주파 성분(부드러운 영역)과 경계나 질감 같은 고주파 성분을 효율적으로 분리하여 처리한다.25 이 다중 해상도 표현 방식은 기존 JPEG보다 월등한 압축 성능을 제공하는 기반이 된다.
2004년, 디즈니, 폭스, 파라마운트 등 7개의 주요 할리우드 스튜디오 연합체인 디지털 시네마 이니셔티브(DCI)는 디지털 영화의 제작, 배포, 상영 전 과정에 사용될 공식 압축 표준으로 JPEG 2000을 채택했다.27 이는 고해상도(2K, 4K), 높은 비트 깊이, 넓은 색 공간 등 디지털 시네마가 요구하는 매우 엄격한 품질 기준을 JPEG 2000이 만족시킬 수 있었기 때문이다.29
DCI는 전 세계 영화 산업에서 장비와 콘텐츠의 상호 운용성을 보장하기 위해 JPEG 2000의 다양한 기능 중 사용할 파라미터를 매우 구체적으로 명시했다.29
해상도 및 비트레이트: 2K(2048x1080) 및 4K(4096x2160) 해상도를 지원하며, 최대 비트레이트는 초당 250 메가비트(Mbps)로 제한된다.28
다음 표는 DCI 표준의 핵심 기술 요구사항을 체계적으로 정리하여, JPEG 2000이 디지털 시네마라는 고품질 응용 분야의 요구를 어떻게 만족시켰는지 구체적으로 보여준다. 이는 DCI 표준이 단순한 규칙의 집합이 아니라, 최고의 시청 경험을 제공하기 위한 의도적인 기술적 선택의 결과물임을 이해하는 데 도움을 준다.
| 파라미터 | DCI 요구사항 | 목적 및 의의 |
|---|---|---|
| 압축 표준 | JPEG 2000 Part 1 | 공개 표준 기반, 고품질, 고기능성 압축 |
| 웨이블릿 필터 | 9/7 비가역(Irreversible) 웨이블릿 | 시각적 품질이 우수한 손실 압축에 최적화 |
| 비트 깊이 | 채널당 12 비트 | 넓은 다이나믹 레인지와 정밀한 색상 표현 |
| 색 공간 | X’Y’Z’ | 장치 독립적인 표준 색 공간 |
| 크로마 서브샘플링 | 허용 안 함 (4:4:4) | 색상 정보 손실 최소화 |
| 타일링 | 단일 타일 (Tiling Disallowed) | 이미지 전체를 하나의 단위로 처리 |
| 해상도 | 2K (2048x1080), 4K (4096x2160) | 고해상도 영화 상영 지원 |
| 최대 비트레이트 | 250 Mbps | 고품질 영상 데이터 전송 보장 |
| 확장성 | 4K 파일에서 2K 영상 추출 가능해야 함 | 단일 마스터 파일로 다양한 상영 환경 대응 |
전통적인 시계열 분석은 시간 영역이나 주파수 영역 중 한쪽에 치우치는 경향이 있었다. RNN, LSTM, CNN과 같은 딥러닝 모델들은 주로 시간 영역의 순차적 패턴을 학습하는 데 강력한 성능을 보여왔다.33 그러나 최근 연구들은 웨이블릿 변환을 딥러닝 모델에 통합하여 시간과 주파수 정보를 동시에 활용하는 새로운 패러다임을 제시하고 있다. 이 융합은 특히 변동성이 크고 복잡한 비정상 시계열 데이터에 대한 분석 및 예측 성능을 획기적으로 향상시키고 있다.35
딥러닝 모델과 웨이블릿의 결합에서, 웨이블릿 변환은 일종의 지능형 특징 추출기 역할을 수행한다. DWT를 딥러닝 모델의 전처리 단계나 네트워크의 초기 계층으로 사용하여, 원시 시계열 데이터를 여러 주파수 대역을 대표하는 부-계열(sub-series)들로 분해한다.33 이렇게 분해된 부-계열들은 신호의 장기적인 추세(저주파 성분)와 단기적인 변동 및 잡음(고주파 성분)을 자연스럽게 분리하여 나타낸다. 이는 딥러닝 모델이 뒤섞인 정보 속에서 헤매지 않고, 더 의미 있고 분리 가능한 특징들을 효과적으로 학습하도록 돕는다.33
기존의 하이브리드 모델이 고정된 웨이블릿 필터를 사용하는 것에서 한 걸음 더 나아가, 웨이블릿 분해 과정 자체를 학습 가능한 신경망 계층으로 설계한 구조가 다단계 웨이블릿 분해 네트워크(multilevel Wavelet Decomposition Network, mWDN)이다.34 mWDN은 DWT의 저역/고역 통과 필터링 및 다운샘플링 과정을 학습 가능한 가중치 행렬과 풀링 계층으로 구현한다. 이를 통해 딥러닝의 역전파(back-propagation) 알고리즘을 사용하여 분석하려는 데이터에 최적화된 필터를 자동으로 학습할 수 있다. 이는 웨이블릿 분석을 딥러닝 프레임워크에 완벽하게 내장(embedding)시켜, 특징 추출과 모델 학습이 종단간(end-to-end) 방식으로 동시에 최적화되도록 하는 혁신적인 접근법이다.34
최근에는 mWDN을 넘어, 웨이블릿 기저 함수 자체와 웨이블릿 계수를 처리하는 방식(예: 잡음 제거를 위한 임계값 설정)까지 모두 데이터로부터 학습시키는 연구도 활발히 진행되고 있다.35 이는 데이터에 대한 사전 지식 없이도 최적의 희소 표현을 자동으로 학습하는 완전한 비지도 학습 도구로의 발전을 의미하며, 웨이블릿과 딥러닝의 융합이 나아갈 궁극적인 방향을 제시한다.
이러한 융합은 두 기술의 약점을 상호 보완하는 공생 관계를 형성한다. 딥러닝은 강력한 비선형 패턴 인식 능력을 가졌지만, 그 과정이 ‘블랙박스’에 가까워 데이터의 물리적 의미(예: 주파수)를 직접 이해하지 못한다.40 반면, 웨이블릿은 신호를 물리적으로 해석 가능한 주파수 대역으로 명확하게 분해하지만, 미리 정해진 고정된 기저 함수로 인해 특정 데이터에 대한 유연성이 부족할 수 있다.11 이 둘의 결합은 웨이블릿이 딥러닝에 ‘해석 가능성’을 부여하고, 딥러닝이 웨이블릿에 데이터 ‘적응성’을 부여하는 상호 보완적인 관계를 만든다. 이는 ‘해석 가능한 물리적 모델링’과 ‘데이터 주도적 패턴 학습’의 장점을 모두 취하는 새로운 하이브리드 인텔리전스를 창출하며, 향후 인공지능 모델이 더 강력해질 뿐만 아니라 더 신뢰할 수 있고 설명 가능해지는 방향으로 발전할 것임을 시사한다.
웨이블릿 변환은 단시간 푸리에 변환(STFT)의 고정된 시간-주파수 해상도라는 근본적인 한계를 극복하고, 다중 해상도 분석이라는 혁신적인 개념을 도입함으로써 신호 처리 분야에 패러다임의 전환을 가져왔다. 이는 시간에 따라 주파수 특성이 변하는 비정상 신호 분석, 데이터 압축, 잡음 제거 등 다양한 분야에서 기존 기술의 성능을 뛰어넘는 결과를 이끌었다. 특히, DWT 기반의 JPEG 2000이 디지털 시네마의 공식 표준으로 채택되면서 산업 전반에 막대한 영향을 미쳤다.
현재 웨이블릿 변환은 다양한 과학 및 공학 분야에서 표준 분석 도구로 확고히 자리 잡은 성숙한 기술이다. 동시에, 딥러닝과의 융합을 통해 시계열 분석 및 예측 분야에서 제2의 전성기를 맞이하고 있다. 복잡하고 잡음이 많은 실제 데이터로부터 의미 있는 특징을 자동으로 추출하고 분리하는 핵심적인 전처리 및 네트워크 구성 요소로서 그 가치를 다시 한번 입증하고 있다.
결론적으로, 웨이블릿 변환은 그 자체로 완결된 이론에 머무는 것이 아니라, 새로운 데이터와 문제에 맞게 끊임없이 진화하고 인공지능과 같은 다른 첨단 기술과 융합하는 살아있는 프레임워크로서 미래 기술 환경에서도 그 중요성과 가치를 이어갈 것이다.
| JPEG2000 applications: digital cinema and broadcasting | Fastvideo - fastcompression.com, accessed August 17, 2025, https://www.fastcompression.com/blog/jpeg2000-applications-part1.htm |
| Fully learnable deep wavelet transform for unsupervised monitoring of high-frequency time series | PNAS, accessed August 17, 2025, https://www.pnas.org/doi/10.1073/pnas.2106598119 |