スケール空間

読み: すけーるくうかん

画像をさまざまなスケール (粗さ) で表現する連続的な枠組み。ガウシアンぼかしのパラメータ σ を変化させることで、異なる解像度での画像構造を統一的に解析できる。

スケール空間 (Scale Space) は、画像を異なるスケールで観察したときの構造変化を数学的に記述する理論的枠組みである。1983 年に Witkin が提唱し、Lindeberg が公理的に体系化した。ガウシアンカーネルによる畳み込みが唯一の線形スケール空間カーネルであることが証明されている。

スケール空間表現 L(x, y, σ) は、元画像 I(x, y) とガウシアン G(x, y, σ) の畳み込みで定義される。σ が大きいほど細かい構造が消失し、大域的な構造のみが残る。σ = 0 が元画像に対応し、σ → ∞ で画像全体が一様な値に収束する。

ガウシアンの役割: ガウシアンぼかしは因果性 (新しい構造を生まない)、等方性、線形性を満たす唯一のカーネルであり、スケール空間の基盤となる
DoG (Difference of Gaussians): 隣接する σ のガウシアン画像の差分を取ることで、特定スケールのエッジや特徴点を検出する。SIFT の特徴点検出に使用される
スケール選択: 特徴点の「自然なスケール」を自動決定する仕組み。LoG (Laplacian of Gaussian) の正規化応答が極大となる σ がその特徴の固有スケールとなる

スケール空間理論はコンピュータビジョンの基礎であり、SIFT、SURF、ORB などの特徴量記述子はすべてスケール空間上での特徴点検出を前提としている。物体認識やパノラマ合成において、撮影距離やズームの違いに頑健なマッチングを実現する鍵となる技術である。

スケール空間

関連用語

関連記事