EN JA ZH ES

Mecanismo de atención

Componente de redes neuronales que calcula dinámicamente puntuaciones de relevancia entre los elementos de entrada, permitiendo al modelo enfocarse en las partes más informativas de los datos.

Un mecanismo de atención calcula dinámicamente pesos de importancia para cada elemento de una entrada, permitiendo al modelo enfocarse en la información más relevante. Propuesto originalmente para traducción automática en 2014, se convirtió en la piedra angular de la arquitectura Transformer en 2017.

En visión por computadora, la autoatención modela dependencias de largo alcance entre posiciones espaciales distantes, superando el campo receptivo limitado de las convoluciones. Vision Transformer (ViT) demostró que la autoatención pura sobre parches de imagen puede igualar o superar el rendimiento de las CNN.

La atención es integral para la detección de objetos (DETR), segmentación y generación de imágenes. El coste cuadrático ha impulsado variantes eficientes incluyendo atención lineal, flash attention y patrones dispersos.

Términos relacionados

Artículos relacionados