Red neuronal

Modelo matemático inspirado en los circuitos neuronales biológicos, compuesto por capas de entrada, ocultas y de salida, que sirve como base para tareas avanzadas de procesamiento de imágenes.

Una red neuronal es un modelo computacional inspirado en las neuronas biológicas. Cada neurona artificial calcula una suma ponderada de entradas, aplica una función de activación y pasa el resultado hacia adelante. Apilar estas unidades en múltiples capas permite aprender tareas complejas como clasificación de imágenes, detección de objetos y generación de imágenes.

Componentes principales:

Capa de entrada: Recibe datos sin procesar. Para imágenes RGB, la entrada es un tensor de ancho × alto × 3
Capas ocultas: Aplican transformaciones no lineales. Redes más profundas representan patrones más complejos (aprendizaje profundo)
Capa de salida: Produce resultados específicos de la tarea - probabilidades de clase para clasificación, valores continuos para regresión
Funciones de activación: ReLU, Sigmoid, Tanh introducen no linealidad para fronteras de decisión complejas

El entrenamiento usa retropropagación, propagando gradientes de pérdida desde la salida hasta la entrada para actualizar pesos. Los optimizadores comunes incluyen SGD, Adam y AdaGrad.

model = Sequential([Dense(128, activation='relu'), Dense(10, activation='softmax')]) - Ejemplo en Keras
loss = nn.CrossEntropyLoss() - Pérdida de clasificación en PyTorch

En procesamiento de imágenes, las redes totalmente conectadas no pueden explotar la estructura espacial, lo que llevó a las CNN. Más allá de las CNN, las GAN, Vision Transformers y modelos de difusión han expandido drásticamente las capacidades de visión por computadora.

Red neuronal

Términos relacionados

Artículos relacionados