Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información. pour plus d'informations.
En el aprendizaje por refuerzo, la recompensa es la señal que se envía a un agente para informarle de la calidad de su acción en un estado determinado.