El Sistema de Aprendizaje pemio/ CAstigo funciona como el veredicto de un critico mas que como la funcion de un maestro o un experto: señala y refuerza la accion de la red con las respuestas correctas o dentro del patron apropiado, castigando con un debilitamiento de los pesos las salidas equivocadas o alejadas de lo esperado.
El aprendizaje estocastico asgina pesos en base a funciones de disribucion de probabilidades. Generalmente es un complemento a los anteriores tipos de aprendizajes vistos.
No hay comentarios:
Publicar un comentario