JA EN

画像圧縮アルゴリズムの深層 - DCT、ウェーブレット変換、予測符号化の仕組み

· 約 9 分で読めます

画像圧縮の基本原理 - 冗長性の除去と人間の視覚特性の活用

画像圧縮は、画像データに含まれる冗長性 (redundancy) を除去してファイルサイズを削減する技術です。無圧縮の画像は膨大なデータ量を持ちます。例えば 4,000 × 3,000 px の 24 ビットカラー画像は 4000 x 3000 x 3 = 36MB のデータ量になりますが、JPEG 圧縮により 2-5MB 程度に削減できます。

画像データに含まれる冗長性の種類:

圧縮アルゴリズムの分類:

現代の画像圧縮は、変換 (Transform) → 量子化 (Quantization) → エントロピー符号化 (Entropy Coding) の 3 段階パイプラインが基本構造です。各段階で異なる種類の冗長性を除去します。

DCT (離散コサイン変換) - JPEG 圧縮の核心技術

DCT (Discrete Cosine Transform) は JPEG 圧縮の中核をなす数学的変換です。画像を空間領域 (ピクセル値) から周波数領域 (周波数成分の強度) に変換し、人間の目に見えにくい高周波成分を効率的に削除可能にします。

JPEG の DCT 処理フロー:

DCT の数学的定義 (2 次元):

F(u,v) = (1/4) * C(u) * C(v) * Σ Σ f(x,y) * cos((2x+1)uπ/16) * cos((2y+1)vπ/16)

ここで f(x,y) は元のピクセル値、F(u,v) は周波数係数、C(u) は正規化定数です。この変換は可逆であり、逆 DCT (IDCT) で元のピクセル値を復元できます (量子化前であれば完全に復元可能)。

ウェーブレット変換 - JPEG 2000 と次世代圧縮の基盤

ウェーブレット変換 (Wavelet Transform) は、DCT の限界を克服するために開発された変換手法です。JPEG 2000、HEIF の一部モード、医療画像 (DICOM) などで使用されています。DCT が固定サイズのブロック (8x8) で処理するのに対し、ウェーブレット変換は画像全体を多重解像度で分解します。

ウェーブレット変換の仕組み:

ウェーブレット変換の DCT に対する優位性:

JPEG 2000 で使用される CDF 9/7 ウェーブレット (非可逆) と CDF 5/3 ウェーブレット (可逆) は、画像圧縮に最適化されたフィルタ係数を持ちます。

予測符号化とイントラ予測 - AV1/HEVC の高効率圧縮

予測符号化 (Predictive Coding) は、既に処理済みの隣接ピクセルから現在のピクセル値を予測し、予測値との差分 (残差) のみを符号化する手法です。予測が正確であるほど残差が小さくなり、高い圧縮率が得られます。AVIF (AV1) や HEIF (HEVC/H.265) で使用される最新の圧縮技術の核心です。

イントラ予測 (Intra Prediction) の仕組み:

AV1 の圧縮効率が高い理由:

エントロピー符号化 - ハフマン符号と算術符号の原理

エントロピー符号化は、データの統計的冗長性を除去する最終段階の処理です。シンボル (値) の出現確率に基づいて可変長のビット列を割り当て、理論的な最小サイズ (シャノンエントロピー) に近づけます。

主要なエントロピー符号化方式:

シャノンエントロピーの式: H = -Σ p(x) * log2(p(x))

この値が理論的な最小ビット数/シンボルを表します。例えば、2 つのシンボルが等確率 (50%/50%) で出現する場合、エントロピーは 1 ビット/シンボルです。一方が 99% で出現する場合、エントロピーは約 0.08 ビット/シンボルとなり、大幅な圧縮が可能です。

圧縮品質の評価指標 - PSNR, SSIM, VMAF の違いと使い方

画像圧縮の品質を客観的に評価するための指標は複数存在し、それぞれ異なる側面を測定します。適切な指標を選択することで、圧縮パラメータの最適化やフォーマット間の公平な比較が可能になります。

主要な品質評価指標:

実務での使い分け: 大量の画像を高速に比較する場合は SSIM、最も正確な知覚品質を評価する場合は VMAF、圧縮パラメータの自動チューニングには Butteraugli が適しています。複数の指標を組み合わせて総合的に判断することが推奨されます。

関連記事

画像圧縮の仕組みを徹底解説 - JPEG ・ PNG ・ WebP の違い

JPEG、PNG、WebP の圧縮アルゴリズムの違いを技術的に解説。非可逆圧縮と可逆圧縮の原理、各フォーマットの得意分野、実務での使い分けを具体的なデータとともに紹介します。

画像フォーマット比較表 - JPEG/PNG/WebP/AVIF/GIF/BMP の特徴と使い分け

主要な画像フォーマット 6 種類の技術的特徴を比較。圧縮方式、対応色深度、透過、アニメーション、ブラウザ対応状況を一覧表で整理し、用途別の最適な選択を解説します。

ウェーブレット変換と JPEG 2000 の仕組み - 多重解像度解析による画像圧縮

ウェーブレット変換の原理から JPEG 2000 の圧縮アルゴリズムまで解説。DWT、サブバンド符号化、EBCOT の仕組みを具体例とともに紹介します。

周波数領域での画像処理 - FFT と DCT による解析・フィルタリングの実践

画像を周波数領域に変換して処理する手法を解説。FFT によるスペクトル解析、DCT による圧縮原理、周波数フィルタリングの設計と実装を具体例とともに紹介します。

可逆圧縮 vs 非可逆圧縮 - 画像圧縮方式の選び方ガイド

可逆圧縮と非可逆圧縮の仕組み・特徴・用途を比較し、画像の種類や目的に応じた最適な圧縮方式の選び方を解説します。

フーリエフィルタリングによるノイズ除去 - 周波数領域での画像処理

フーリエ変換を用いた画像のノイズ除去手法を解説。DFT の原理、ローパス・ハイパスフィルタ、ノッチフィルタの設計と実装を紹介します。

関連用語