Alguien alcanzó el puntaje perfecto en Ms. Pac-Man y no es un humano

¿Se acuerdan del clásico de arcade Ms. Pac-Man? Alguien ha conseguido el puntaje perfecto en este difícil juego, pero ¿saben qué? quien logró la hazaña no fue un humano, fue la inteligencia artificial.

Se trata de un sistema de inteligencia artificial creado por Maluuba, una empresa adquirida por Microsoft a comienzos de este año. Dicho sistema logró obtener los 999,900 puntos en un Atari 2600, usando lo que ellos llaman la Arquitectura Híbrida de Recompensa, que es una combinación del algoritmo “divide y vencerás” y el aprendizaje reforzado.

Como dice el blog de Microsoft, “para obtener el máximo puntaje en el juego, el equipo de Maluuba dividió el desafío de superar Ms. Pac-Man en partes pequeñas, que distribuyeron en agentes de inteligencia artificial” (alrededor de 150 agentes).

De esta forma diferentes piezas trabajaron en un mismo objetivo. Por ejemplo, un agente debía encargarse de obtener un determinado Power Pellet, el poder que permite comerse a los fantasmas en Ms. Pac-Man, y otros agentes tenían la tarea de alejarse de los fantasmas. Al final se creó un agente principal que tomó sugerencias de todos los agentes y las utlilizó para decidir los movimientos de Ms. Pac-Man.

ms_pacman

Esto no solo significa un hecho interesante en el mundo de los videojuegos, sino que también es importante para los investigadores que trabajan con la inteligencia artificial. Éstos han usado varios juegos para probar sus sistemas, sin embargo consideraban que Ms. Pac-Man era de los más difíciles por superar.

Una profesora asociada de la Universidad McGill llamada Doina Precup mencionó que “esto es similar a la manera en que el cerebro funciona según algunas teorías y podría ser trascendental para enseñarle a los sistemas de inteligencia artificial a realizar tareas complejas con información limitada”, lo cual significaría “otro paso hacia más inteligencia a nivel general”.

El hecho de seleccionar Ms. Pac-Man tiene una razón de ser, ya que de acuerdo a Rahul Mehrotta, gerente de programa en Maluuba, es complejo descubrir el modo como ganar en los juegos clásicos de los ochenta ya que existen muchas variables que se pueden encontrar a la hora de jugar.

El equipo utilizó el reforzamiento de aprendizaje, un método de inteligencia artificial en el cual los sistemas mejoran una tarea por medio de prueba y error. En este modelo, un agente obtiene respuestas positivas o negativas para cada acción que intenta y aprende a maximizar las respuestas positivas o las recompensas.

Ver en YouTube

Leave a Reply

Your email address will not be published. Required fields are marked *