JA EN ZH

编码器-解码器

一种由编码器将输入压缩为紧凑潜在表示、解码器从该表示重建目标输出的神经网络架构。

编码器-解码器架构是一种两阶段网络,编码器将输入压缩为低维特征表示,解码器从中重建目标输出。在计算机视觉中,这一模式支撑着语义分割、超分辨率和图像到图像的转换。

编码器通过重复的卷积和池化操作降低空间分辨率同时增加通道深度。256x256x3 的输入可能被压缩为 8x8x512。解码器使用转置卷积或双线性上采样逆转此过程,恢复空间维度以生成最终输出。

预训练编码器(在 ImageNet 上训练的 ResNet、VGG)通过迁移学习提供强大的特征提取器,使有限标注数据也能达到高精度。解码器设计对输出质量有显著影响。

Related Terms

Related Articles