en esta sección pensamos que podemos 
hablar de un concepto de avanzada y tiene

que ver con las formas en que el 
aprendizaje de máquina mejoró los

algoritmos tradicionales; en particular el
algoritmo de 20 pilas de carga es uno con

el cual trabajé durante mis 
investigaciones

imaginemos que queremos encontrar algo 
que se llama el valor esperado de una

función; esto es en muchos sistemas operan
bajo diferentes condiciones y queremos

saber como se comporta el sistema en 
promedio

una forma de averiguar este promedio es
correr algo que se llama procedimiento de

Monte Carlo y si recuerdan, en la sección
del Go, ya hablamos del árbol de búsqueda

de Monte Carlo y acá estamos trabajando
con la misma idea

Digamos que tenemos un dado y queremos
saber qué número podemos esperar en

promedio, sopesando cada número en función
de su propio valor; entonces lo que

podemos hacer es tirar los dados varias 
veces, puede ser que la 1ra vez saquemos

un 2, luego un 6 y luego otro 2 y luego 
otro 3 y seguimos tirando el dado y puede

ser que tengamos un promedio de 3.4

ahora el verdadero promedio de un dado es
3.5, eso quiere decir que no tuvimos el

número exacto, pero estuvimos muy cerca

esto se usa también en otros sistemas, por
ejemplo supongamos que tenemos un avión y

queremos saber el arrastre que tiene ese
avión; los aviones están muy bien

ajustados para comportarse bien bajo una
serie de condiciones; por lo tanto cuando

volamos nuestro avión 4 veces hallamos que
los valores de arrastre es de 8.6, 8.4 y

otro 8.4 y otro 8.5 y tenemos un valor
promedio de 8.4

podemos imaginar en 1er lugar, que es muy
costoso volar un avión y por lo tanto

queremos encontrar este valor esperado,
este desempeño esperado usando la menor

cantidad de vuelos posibles, debido a que
cada vuelo es muy costoso

la otra idea clave acá para tomar nota es
que con el ejemplo del dado encontramos

que con un par de tiradas, tenemos un 
error muy grande, mientras que en el

ejemplo del avión, luego de una serie de
vuelos, el error es muy pequeño y esto se

debe a que los números del dado varían
todo el tiempo de 1 a 6, mientras que con

el ejemplo del desempeño del avión los
valores están más cerca unos de otros, 8.6

8.4; entonces un concepto clave es el de
Monte Carlo, donde mientras las

simulaciones cambien más, más grande va a
ser el error en relación a lo mal que

podemos predecir el valor esperado

la forma en que esto funciona es que en el
avión tenemos muchos sensores que miden

las condiciones mientras dura el vuelo;
entonces no es que conocemos solo el valor

del arrastre, por ejemplo puede ser que
también conozcamos el número de Mach al

que estaba volando el avión; esto es cuan
rápido el avión volaba en relación a la

velocidad del sonido y tenemos estas
relaciones de entrada y salida, donde la

entrada es cuan rápido estamos volando y
la salida es el arrastre del avión y otra

vez, queremos saber el arrastre promedio

en una cantidad de vuelos, por ejemplo
sabemos cuanto combustible necesita

y a la derecha vemos una gráfica donde el
eje X tiene el número de Mach del vuelo,

el eje Y tiene el valor del arrastre y la
línea azul es el valor verdadero del

arrastre que cruza con el número Mach;
ahora el avión no se comporta de este modo

así que no continuen y no lo usen para sus
diseños, pero nos permite una intuición

donde ahora lo que podemos hacer es tomar
las entradas de los datos del número Mach

y aprender cual será el arrastre como una
función de los datos de entrada

puede que ahora tengamos la línea verde
punteada que se ve en la imagen; vemos que

no es una coincidencia exacta, no ajusta
perfectamente en cuanto a la cantidad de

arrastre, pero podemos ver que hizo un
buen trabajo aún cuando teníamos sólo un

pequeño número de muestras

el concepto clave es que lo que podemos
hacer es que podemos tomar esas 2 líneas y

restarlas una de otra y así podemos tener
lo que llamamos una superficie

regularizada donde tendremos la conducta
verdadera, cuando eliminemos los efectos

podemos aprenderlo muy bien y lo que ahora
tenemos es la línea roja por debajo y esa

es la diferencia entre el valor verdadero
estimado y el valor aprendido por la compu

y ahora podemos usar Monte Carlo sobre
este objeto y si recuerdan Monte Carlo

tiene un gran error cuando los números
cambian mucho, pero trayendolos a esta

superficie de aprendizaje vemos que la
función es mucho más suave, los zigzags no

son tan pronunciados y entonces el error
esperado va a bajar mucho, simplemente

debido a que redujimos lo que llamamos la
varianza de la función; cuánto es que la

función zigzaguea por ahí

y si somos indulgentes con el 
deslizamiento técnico, el eje X acá

muestra cuantas muestras tenemos, cuantas
veces tenemos que volar nuestro avión y el

eje Y tiene el error, cuan equivocados 
estamos en relación al estimador, dado ese

número de muestras, en promedio; entonces
para poder generar este gráfico, tuve que

correr este procedimiento idealizado 
muchas veces para ver si funciona bien

lo que vemos es que en todas estas líneas
el error va para abajo a medida que usamos

más muestras y eso tiene sentido, mientras
más datos tengamos mejor lo vamos a hacer

pero esto también nos dice que la línea
verde hubiera sido si usábamos Monte Carlo

hubiéramos tomado sólo 2 valores de
promedio del mismo modo que lo hicimos con

el dado

la línea roja muestra que hubiera pasado
si sólo hubiéramos usado el aprendizaje de

máquina; hubiéramos tomado nuestras 
muestras, ajustar el aprendizaje de

máquina y ver la performance promedio del
aprendizaje de máquina

y la línea azul muestra este procedimiento
del que ya les hablé, donde combinamos

estas 2 cosas juntas y nos da esta 
superficie de Monte Carlo diferente y esa

esa la línea azul donde hemos combinado
las 2 y vemos que para todos los números

de las muestras, sin importar cuantos 
puntos de datos tengo, la pila de Monte

Carlo tiene el menor error estimado

entonces lo que vemos acá es que si usamos
Monte Carlo, una técnica que fue inventada

durante el Proyecto Manhattan en los 40,
pero si usamos el aprendizaje de máquina

podemos mejorar esta idea bien simple y
bajar el error, por ejemplo bajando el nro

de vuelos de avión que necesitamos para
tener un buen estimador del arrastre

vayamos atrás un par de lecturas a donde
vimos como las computadoras juegan al Go

podemos ver que esa clase de idea está
relacionada con el programa AlphaGo y por

qué fue tan efectivo; entonces un AlphaGo
que tiene el árbol de búsqueda de Monte

Carlo, donde se pueden jugar juegos al 
azar para medir la probabilidad de ganar,

eso no es lo único que hacen, también
aumentan la probabilidad de ganar con lo

que llamamos la función de valor que 
estima cuan bien se encuentra una posición

dada y combinando estas 2 ideas, permiten
regularizar a Monte Carlo y hacer que la

estimación de ganar sea mucho más certera
que de otra forma

esto concluye nuestro tutorial, gracias 
por unirse; esperemos que hayan obtenido

una buena imagen del aprendizaje de 
máquina y que estén ya equipados para

poder aprender más; una muy buena forma de
aprender más es mirando el material

suplementario que hemos incluído, hay ahí
mucha más información acerca de los temas

que hemos estado discutiendo; esperemos 
que hayan disfrutado esas lecciones y

esperemos que estén ansiosos por aprender 
más