la última vez que estuvimos acá, finalizamos la discusión sobre la introducción sobre los fundamentos del aprendizaje de máquina y hoy vamos a hablar y en las clases siguientes sobre un caso de estudio en aprendizaje de máquina aplicado a un sistema específico; entonces los juegos de tablero tienen una larga historia en IA, desde la década del 50 y se usaron como una guía para los 1ros desarrollos en aprendizaje artificial y en inteligencia de máquina; pero por qué esto fue así? por qué nos ocupamos de los juegos de tablero; bueno, por 1 lado los juegos de tablero son sistemas verdaderamente aislados donde sabemos que significa ganar, conocemos todas las movidas y podemos saber las consecuencias de estas acciones, a diferencia del mundo real donde las cosas son bien complicadas y la gente cambia y el tiempo cambia y entonces es difícil obtener un lindo sistema replicable; mientras que en los juegos de tablero, las reglas del ajedrez han sido las mismas por cientos de años pero también porque los juegos de tablero se usaron como parámetro de lo que la gente piensa que es la inteligencia y más allá de si esto es verdad o no, podemos ver que hay muchas características en los juegos de tablero que se asemejan a las del mundo verdadero; entonces en particular en este artículo de la revista Byte del año 1978, podemos ver que estas características son en verdad importantes para poder jugar; uno tiene que planear una estrategia para darse cuenta qué movida va a realizar y como ejecutarla, uno tiene que planear cuales van a ser los objetivos, tanto en el corto como en el largo plazo y se necesita poder calcular como se van a desarrollar esas jugadas para poder ejecutar un buen plan; entonces podemos ver como estas características son particulares en el ajedrez pero que a la vez se parecen a las cosas que hacemos en los sistemas del mundo real y de este modo los juegos de tablero son un lugar ideal para comenzar a pensar cómo es que las máquinas pueden hacer cosas que las hacen parecer inteligentes; la ciencia de la computación ha estado construyendo máquinas para jugar a los juegos de tablero desde hace mucho tiempo; en 1952 la máquina Oxo se las arregló para jugar un juego perfecto de ta te tí; más adelante en 1995 la computadora Chinnok se transformó en la 1er campeona mundial de damas; ahora técnicamente no debería ser campeona del mundo tomando en cuenta la forma en que lo pueden hacer las computadoras; los humanos son seres morales y de hecho el mejor jugador humano de damas, Marion Tinsley se desmayó en el medio del partido y Marion Tinsley fue tanto mejor que cualquier otro jugador que de repente Chinook se volvió campeona del mundo, pero nunca sabremos si Chinook era mejor y seguramente muchos de ustedes habrán escuchado que en 1997 Deep Blue venció a Gary Kasparov, que era el campeón mundial de ajedrez en ese momento. Entonces vemos que en 1952 tenemos al ta te tí y en 1995 los jugadores de damas son derrotados y en 1997 la computadora se vuelve campeona del mundo de ajedrez; entonces en 1998 como lo estaban haciendo las computadoras? bueno si ven este tablero acá, tal vez no conozcan las reglas, pero la computadora puede hacer 30 movidas al comienzo del juego y aún perder frente a un jugador humano decente, no el mejor jugador humano del mundo, ustedes pueden ver que las computadoras pueden ser las mejores jugadoras de ajedrez, pero aún necesitan al menos 30 30 movidas al comienzo de un juego de go para poder derrotar jugadors humanos buenos tomémosnos un minuto para hablar de las reglas del go y un poco acerca de como es que se juega; 1ro hablaremos de la historia, el go es muy popular en todo el mundo pero especialmente en el este de Asia y hay alrededor de 30 millones de jugadores en todo el mundo y de hecho hay alrededor de 4 o 6 torneos cada año que tienen un premio de un cuarto de millón de dólares El Go tiene aproximadamente entre 2500 y 4000 años y de hecho algunos de los textos más antiguos que tenemos sobre el go son los escritos de Confucio, entonces el go tiene una larga historia En particular el go es un juego, un juego de 2 personas, hay 2 jugadores pero es también determinista, lo que significa que no hay aleatoriedad, si juegan algo como el poker, ustedes no pueden saber que carta les va a tocar, cuando piden cartas en cambio en el go, ustedes hacen una movida y es esa y es también un juego de información perfecta, lo cual implica que ambos jugadores saben todo lo que sucede entonces pueden imaginar que es un juego sobre la guerra donde hay una niebla puede que uno tenga algunas piezas, pero no sé donde están esas piezas; pero el go no es eso, todo el mundo sabe todo, lo cual lo hace un muy buen sistema para el aprendizaje de máquina debido a que no tenemos ninguna información oculta la forma en que funciona es que hay 2 jugadores, negros y blancos y hay jugadas alternadas, el tablero tiene 99 puntos por 99 puntos y los jugadores en turnos juegan en las intersecciones, la siguiente idea es la de capturar, si tenés un grupo de piedras, que están conectadas por puntos y se ven completamente rodeadas por las piedras del otro color, entonces esas piedras se quitan del tablero; los jugadores negro y blanco van y vienen tomando todas las piedras que sean necesarias a medida que son capturadas y al final del juego vemos quien pudo rodear la mayor cantidad de territorio y lo que hacemos es contar el territorio rodeado por ambos jugadores y luego contamos la cantidad de piedras que fueron capturadas y el que tiene la mayor cantidad de puntos gana; esas no son todas las reglas del go pero son casi todas las reglas y con eso es suficiente para que puedan seguir adelante y tengan una idea de como se juega volviendo al go computarizado, como les dije, en 1998,las computadoras jugaban muy mal y alrededor del año 2000 se alcanzó uno de los 1ros hitos, del que hablaremos más tarde, pero en 2004 una computadora perdió contra un profesional con un handicap de 9 piedras, que es un gran handicap, pero es mucho menos que 30 piedras y alrededor del 2010, se alcanzó una nueva marca en piedras, la computadora derrotó a un profesional con un handicap de 7 piedras y 5 años después, en 2015 una computadora derrotó a un profesional con un handicap de 5 piedras, entre 2004 y 2015, en esos 11 años, se pudo bajar 4 piedras de handicap un par de eses después, en marzo de 2016, el programa AlphaGo derrotó a Lee Sedoi que es uno de los mejores profesionales actualmente y que tiene un handicap de 0 piedras; se tardaron 11 años para bajar 4 piedras y luego en 3 meses se pasó de 5 piedras a derrotar a uno de los mejores profesionales y un par de meses después la 2da versión del programa AlphaGo Master derrotó al profesional Kie Jie 3 a 0, la máquina no perdió y Kie Jie es uno de los mejores jugadores de todos los tiempos y luego, hace poco, hace unos meses, AlphaGo 0 salió de circulación y venció a la versión master de AlphaGo 89 a 11, se tardó 11 años poder bajar 4 piedras, pero en el último año y medio, se le pudo ganar a los mejores jugadores y ganarle a programas que le ganaron a los mejores jugadores, una inmensa cantidad de progreso se logró