Aprendizaje reforzado

Autor: Lewis Jackson
Fecha De Creación: 11 Mayo 2021
Fecha De Actualización: 15 Mayo 2024
Anonim
El APRENDIZAJE REFORZADO: la guía DEFINITIVA
Video: El APRENDIZAJE REFORZADO: la guía DEFINITIVA

Contenido

Definición - ¿Qué significa el aprendizaje por refuerzo?

El aprendizaje de refuerzo, en el caso de la inteligencia artificial, es un tipo de programación dinámica que entrena algoritmos usando un sistema de recompensa y castigo.


Un algoritmo de aprendizaje de refuerzo, o agente, aprende interactuando con su entorno. El agente recibe recompensas por realizar correctamente y sanciones por realizar incorrectamente. El agente aprende sin intervención de un humano maximizando su recompensa y minimizando su penalización.

Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica el aprendizaje por refuerzo

El aprendizaje de refuerzo es un enfoque del aprendizaje automático inspirado en la psicología conductista. Es similar a cómo un niño aprende a realizar una nueva tarea. El aprendizaje por refuerzo contrasta con otros enfoques de aprendizaje automático en que el algoritmo no se le dice explícitamente cómo realizar una tarea, sino que resuelve el problema por sí solo.


Como agente, que podría ser un automóvil autónomo o un programa que juega ajedrez, interactúa con su entorno, recibe un estado de recompensa dependiendo de cómo se desempeña, como conducir a un destino de manera segura o ganar un juego. Por el contrario, el agente recibe una multa por actuar incorrectamente, como salir de la carretera o ser jaqueado.

El agente con el tiempo toma decisiones para maximizar su recompensa y minimizar su penalización mediante programación dinámica. La ventaja de este enfoque de la inteligencia artificial es que permite que un programa de IA aprenda sin que un programador explique cómo un agente debe realizar la tarea.