al comienzo de la última lectura, hablamos
acerca de como los juegos de tablero de

este lindo ambiente contenido son aptos
para realizar estudios de aprendizaje de

máquina e inteligencia artificial. Hoy
vamos a hablar del Go como un problema de

aprendizaje supervisado; en particular
pueden notar que eso es lo que es, un

problema de aprendizaje supervisado,
entonces tenemos un estado del tablero que

contienen un montón de puntos que están
abiertos, algunas piedras blancas ahí y

algunas piedras negras sobre él; y la meta
de cualquier jugador de Go es encontrar

cual puede ser la siguiente movida. Si sos
un jugador profesional top Hoeing Boshu

Saku, te darás cuenta que ésta es la
respuesta correcta para esta posición en

el tablero, me doy cuenta que muchos de
ustedes no se podrán encontrar esta jugada

pero podemos pensarlo de este modo, así
podemos tomar cada posición en el tablero

y representarla como un vector, así el
punto 1 1 vale 0 debido a que no tiene

ninguna piedra allí y puede que la próxima
posición tenga una piedra blanca y luego

una piedra negra, entonces podemos tomar
eso y decir que las piedras blancas valen

1 y que las piedras negras valen -1 y 
luego listar los 361 puntos como un vector

de 0, 1 y -1; con esa lista podemos tener
un programa que tome eso como una entrada

y que la salida sea la próxima movida,
entonces podemos ver esta relación entre

la entrada y la salida, que ya fue 
mencionada al comienzo

el Go era complicado debido a que los
humanos tienden a pensar acerca de él en

términos de las formas denominadas metano
y proverbios; entonces vemos la forma de

acá que se denomina la unión del bambú y
en el proverbio esto dice que la unión del

bambú tiene una forma fuerte similar a la
forma de Panucci, que se muestra abajo,

que se sabe que es una forma fuerte y que
es buena si podés hacerla o podemos tener

proverbios que se relacionan con como
podemos movernos como miel encima de 2

piedras; pero además tenemos estos meta
proverbios como que los puntos de tu

enemigo son tuyos, que significa que si tu
oponente se quiere ir a algún lado,

entonces es probablemente una buena idea
pensar acerca de que aquello te apunta a

vos o entonces estos meta proverbios como
no confíes en los proverbios ciegamente y

entonces lo que queremos tomar de esta
clase de ideas y codificarlas en un

programa de computadora; pueden imaginar
que es muy difícil escribir una línea de

código que diga no sigas los proverbios en
forma cegada

de la misma manera los jugadores de Go
piensan mucho en este concepto de OG que

se puede traducir más o menos como riesgo
entonces una posición en el tablero puede

ser buena en el cortoplazo pero deja mucho
OG, por lo que nos deja abiertos a mucho

riesgo y entonces el Go es sobre balancear
los puntos que se ganan ahora versus darse

cuenta que nuestra posición no es muy
débil y esta clase de pensamientos son los

que necesitamos que la computadora tenga
si es que queremos que sea una buena

jugadora de Go; entonces necesitamos una
clase de algoritmo de aprendizaje

supervisado que pueda tomar estos 
principios y los traduzca en un juego

efectivo pero codificarlos directamente 
puede ser muy difícil y de hecho lo es y

entonces la pregunta fundamental del Go 
para que un programa de una máquina pueda

jugar al Go es: bueno tenemos este tablero
en blanco, cómo puedo jugar y ganar o por

el contrario, si tenés las blancas, cómo
me puedo defender de las negras y esa es

la clase de idea de alto nivel; cada 
movida que queremos hacer debe tomar ese

vector que codifica la positición en el
tablero y mostrarnos cual es la siguiente

movida que tenemos que hacer