DOI:
https://doi.org/10.14483/2322939X.4086Publicado:
2005-12-01Número:
Vol. 2 Núm. 1 (2005)Sección:
Investigación y DesarrolloSIMULATED ANNEALING PARA LA BÚSQUEDA DE POLÍTICAS ÓPTIMAS EN PROCESOS DE DECISIÓN DE MARKOV
Palabras clave:
Procesos de decisión de Markov, Simulated Annealing, Cadena de Markov, política. (es).Descargas
Resumen (es)
El presente articulo muestra como implementar el algoritmo del simulated annealing, para resolver un ejemplo práctico de procesos de decisión de Markov (MDP). Se presenta una conceptualización básica de los MDP y del algoritmo del simulated annealing, así como descripción del problema y la forma de cómo se realizó el mismo y los resultados obtenidos.
Referencias
Bellman R. E. y Dreyfus S. E. Applied Dynamic Programming, 1a ed. Princeton, New Jersey: Princeton University Press, 1962.
Hillier F. S. y Lieberman G. J. Introducción a la investigación de operaciones, 6a ed. Bogota, Colombia: McGraw Hill, 1999.
Howard R. Dynamic Programming and Markov Process. [Cambridge, MA]: MIT press, 1960.
Ingber L. A. (1993) Simulated annealing: Practice versus theory.
Ingber L. A. (1996) Adaptive simulated annealing (ASA): Lessons learned.
Puterman M. L., Markov Decision Processes: Discrete Stochastic Dynamic Programming. John Wiley & Sons, Inc. 1994.
Moins S. (2002) Implementation of a simulated annealing algorithm for Matlab.
Taha H. A., Investigación de operaciones, 5a ed. Ciudad de Mexico, Mexico: Alfaomega, 1992.