lunes, 22 de noviembre de 2010

Aprendizaje adaptativo

La capacidad de aprendizaje adaptativo es una de las características más atractivas de redes neuronales. Esto es, aprenden a llevar a cabo ciertas tareas mediante un entrenamiento con ejemplos ilustrativos. Como las redes neuronales pueden aprender a diferenciar patrones mediante ejemplos y entrenamientos, no es necesario elaborar modelos a priori ni necesidad de especificar funciones de distribución de probabilidad.

Las redes neuronales son sistemas dinámicos autoadaptativos. Son adaptables debido a la capacidad de autoajuste de los elementos procesales (neuronas) que componen el sistema. Son dinámicos, pues son capaces de estar constantemente cambiando para adaptarse a las nuevas condiciones.
En el proceso de aprendizaje, los enlaces ponderados de las neuronas se ajustan de manera que se obtengan ciertos resultados específicos. Una red neuronal no necesita un algoritmo para resolver un problema, ya que ella puede generar su propia distribución de pesos en los enlaces mediante el aprendizaje. También existen redes que continúan aprendiendo a lo largo de su vida, después de completado su período de entrenamiento.
La función del diseñador es únicamente la obtención de la arquitectura apropiada. No es problema del diseñador el cómo la red aprenderá a discriminar. Sin embargo, sí es necesario que desarrolle un buen algoritmo de aprendizaje que le proporcione a la red la capacidad de discriminar, mediante un entrenamiento con patrones. 

Auto-organización

Las redes neuronales emplean su capacidad de aprendizaje adaptativo para autoorganizar la información que reciben durante el aprendizaje y/o la operación. Mientras que el aprendizaje es la modificación de cada elemento procesal, la autoorganización consiste en la modificación de la red neuronal completa para llevar a cabo un objetivo específico.
Cuando las redes neuronales se usan para reconocer ciertas clases de patrones, ellas autoorganizan la información usada. Por ejemplo, la red llamada backpropagation, creará su propia representación característica, mediante la cual puede reconocer ciertos patrones.
Esta autoorganización provoca la generalización: facultad de las redes neuronales de responder apropiadamente cuando se les presentan datos o situaciones a las que no había sido expuesta anteriormente. El sistema puede generalizar la entrada para obtener una respuesta. Esta característica es muy importante cuando se tiene que solucionar problemas en los cuales la información de entrada no es muy clara; además permite que el sistema dé una solución, incluso cuando la información de entrada está especificada de forma incompleta

sábado, 20 de noviembre de 2010

Premio-Castigo Asociativo

El Sistema de Aprendizaje pemio/ CAstigo funciona como el veredicto de un critico mas que como la funcion de un maestro o un experto: señala y refuerza la accion de la red con las respuestas correctas o dentro del patron apropiado, castigando con un debilitamiento de los pesos las salidas equivocadas o alejadas de lo esperado.
El aprendizaje estocastico asgina pesos en base a funciones de disribucion de probabilidades. Generalmente es un complemento a los anteriores tipos de aprendizajes vistos.

Reforzados


Blog:
Integrantes:
Andrea Onofre
Leticia Duarte
Ronald Crúz
Héctor Sánchez
Héctor Velarde



Clasificación de los Modelos Neuronales

Aprendizaje Reforzado
Este método emplea la información del errorcometido (calculado en este caso de forma global y no para cada una de lassalidas), pero sin poseer la salida deseada. Dicho aprendizaje descansa en laidea dual premio-castigo, donde se refuerza toda aquella acción que permitauna mejora del modelo mediante la definición de una señal crítica.

 Ciclo del aprendizaje reforzado

Los supuestos básicos del aprendizaje por refuerzo son muy simples:

Un agente debe realizar una tarea y dispone de un conjunto deaccionespararesolverla.
El agente escoge la acción o el conjunto de acciones que cree quele permitenresolverlatarea.
Elagenterecibe informacióndelentornosobrecomolohahecho.
Ø  El agente utiliza esa información para modificar sus acciones.
¿Dónde se puede aplicar el aprendizaje reforzado?
Ø  El aprendizaje por refuerzo está orientado a sistemas capaces de Interactuarconelentorno.
El El entorno es capaz de dar una cuantificación numérica del éxito o Fracasodelas accionesdelagente.
El conjunto de estados posibles por los que puede pasar el agentepuedeserdiscretoocontinuo.
Ø  Se pueden plantear diferentes tareas de aprendizaje (Identificar labondad de un conjunto de acciones, determinar el mejor conjunto de acciones.) con diferentes complejidades (desconocimiento de losestados olos efectos delas acciones, efectosnodeterministas,...).
¿Cuándo aplicar el aprendizaje reforzado?
Ø  En este tipo de problemas el generar el conjunto de ejemplos para aprender la tarea es muy costoso.
Ø  Este tipo de aprendizaje esta pensado para problemas demasiado complejos para poder programarlos a mano.
Ø  Es más sencillo permitir a la gente a prender por si mismo.

Elementos para el aprendizaje reforzado
Ø  Un conjunto de estados que describan el entorno (puede ser discreto o continuo).
Ø  Un conjunto de acciones que el agente puede realizar para modificar su entorno.
Ø  Una función de refuerzo que indica al agente el resultado obtenido al realizar una acción sobre el estado.