JA EN

過学習

読み: かがくしゅう

モデルが訓練データに過度に適合し、未知のデータに対する予測精度 (汎化性能) が低下する現象。深層学習における主要な課題の一つ。

過学習 (Overfitting) は、モデルが訓練データのノイズや個別パターンまで記憶してしまい、新しいデータに対する予測性能が劣化する現象である。訓練精度が 99% を超えるのに検証精度が 70% 程度にとどまるような状況が典型例であり、モデルの複雑さに対してデータ量が不足している場合に発生しやすい。

画像認識では、数百万パラメータを持つ CNN を数千枚程度の小規模データセットで学習すると過学習が顕著になる。ResNet-50 は約 2,500 万パラメータを持つため、ImageNet (128 万枚) のような大規模データセットでなければ十分な汎化性能を得にくい。

転移学習は過学習対策としても有効である。大規模データで事前学習したモデルの特徴抽出能力を活用し、少量のタスク固有データでファインチューニングすることで、小規模データセットでも高い汎化性能を実現できる。

関連用語

関連記事