Ahora voy a repasar todos los pasos que seguimos ¿Ok? Porque hemos hecho un viaje largo y han aprendido un gran numero de cosas en la búsqueda de resolver este problema, que al final es un problema simple, El problema que quería resolver ¿Ok? Era una descripción breve de cuanto tiempo toma conseguir un taxi en la cuidad de Nueva York ¿Ok? Y esa descripción breve quería deducirla usando los datos Así que, las cosas que son extensas son decir que la probabilidad de esperar n minutos es el numero de veces que se encontró esperando n minutos por un taxi Esa clase de descripciones decidimos que son demasiado... Se sobre-ajustan a los datos. ¿Ok? En cambio, lo que vamos a hacer es vamos a intentar reproducir un numero limitado de características. No vamos a intentar reproducir, por ejemplo, el numero exacto de veces que esperamos 6 minutos, ¿Ok? O la fracción exacta de veces que esperamos 6 minutos En cambio, lo que vamos a hacer es reproducir algunas características básicas de los datos. En particular, lo que dije fue "¿Sabes que? Lo único que quiero preservar es el promedio del tiempo que toma conseguir un taxi" Eso es todo, olvide todo lo demás Ahora el problema es que hay muchas distribuciones que cumplen esta condición Así que lo que decidimos hacer es tomar la distribución que tenia la máxima entropía sujeta a estar restricciones ¿Ok? Y la razón que dimos era que la distribución con máxima entropía lo deja con la misma incertidumbre sobre el tiempo de espera ¿Ok? No tiene teorías ocultas adicionales. No hay manera de que implícitamente pueda asumir algo mas acerca de los datos que pueda reducir su incertidumbre acerca de lo que va a pasar ¿Ok? Así que, ese era nuestro argumento... Ese era ma o menos nuestra... Justificación intuitiva para este paso de aquí, para maximizar la entropía. Antes usted creía que era bueno hacerlo, luego profundizamos en la matemática, en particular, lo que tenia que hacer era mostrarle como funciona el método de los multiplicadores de Lagrange. Esta es una gran herramienta matemática, es útil no solo en el problema de máxima entropía, si no que lo vera en todos lados, en particular en áreas como la economía ¿Ok? donde el objetivo, de hecho, sus multiplicadores de Lagrange se llaman "Precios Fantasma" ¿Ok? Pero, en esos... En muchos sistemas donde lo que trata de hacer es maximizar una cantidad, pero esta limitado por otro conjunto de restricciones Le mostré como hacer el truco de multiplicadores de Lagrange Le di... le di el problema bidimensional con una restricción y le dije que el problema con restricción final parece o funciona de manera similar ¿Ok? Y después yo en realidad resolví el problema de maximizar restricciones de maximizar la entropía sujeta a estas restricciones y encontramos una forma funcional en particular que era solo una forma funcional. Era solo una forma funcional porque lambda y Z, estas eran los términos ocultos de los multiplicadores de Lagrange, estos eran términos que tuve que fijar a mano. Así que conozco el funcional inmediatamente, pero, ahora tengo que hacer el trabajo duro de determinar cuanto deben valer lambda y Z. Y entonces, tuve que hacer algunas sumas infinitas, jugar algunos juegos matemáticos, espero que se divirtieran, y al final, lo que hemos encontrado es que para estos multiplicadores de Lagrange obtenemos una ecuación trascendental para Lambda 1. Mientras no veían, rápidamente introduje esto en Mathematica y encontré el valor numérico de Lambda 1 que es aproximadamente igual a 0.22 Así que, al terminar todo esto, si esto es 0 minutos, 1, 2, 3, 4, 5, 6, 7... Esto es el tiempo de espera en minutos, esta es la probabilidad de esperar esos minutos. Entonces en los datos, tenemos... Usted sabe, algunas veces esperamos 6 minutos, algunas veces, veamos, 3 minutos, algunas veces esperamos 4 minutos, un par de veces esperamos 2 ¿Ok? Así que, esta es la distribución de los datos que habíamos medido... ¿Bien? Este es el que hubiéramos decido que es un modelo "sobre ajustado". Y de hecho, lo que encontramos es que la distribución es parecida a esta, es una distribución exponencial, en x. ¿Ok? Entonces, esto de aquí, es en cierto sentido el modelo que mejor se ajusta a esto si estuviera desprovisto… si… si… si… Si fijar el valor medio del tiempo de espera fuera la única restricción. Y esto de aquí, con esta particular elección de restricciones para los multiplicadores de Lagrange, acierta en el promedio y nada mas. La incertidumbre es máxima. No es que esto no tenga otras propiedades, por ejemplo, su distribución tiene una varianza. Pero son todas dependientes, todas son escogidas de forma tal que la distribución de aquí tenga la máxima entropía sujeta a una restricción solo en el promedio. Así que, vamos a pensar brevemente sobre este modelo, que por cierto, es mecánicamente agnóstico ¿Bien? No tiene teoría acerba de los taxis, en cualquier parte pudimos, en cambio de modelar el tiempo de espera para taxi, modelar el tiempo de espera para… No se, usted sabe, su próximo vuelo de United, bien, pudimos modelar, usted sabe, el numero de… usted sabe, el numero de terremotos en Japón en un año de cierta magnitud. Pudimos modelar el numero de, usted sabe, C+ que da a los estudiantes en un año en particular ¿Ok? Esta metodología es completamente agnóstica con respecto a la física subyacente, o ciencia cognitiva, o sociología del problema ¿Ok? Pero vamos a mirar y observar si hay algún modelo mecánico implícito que el principio de máxima entropía nos a dado implícitamente. En particular, vamos a ver si podemos construir, y seremos capases de hacerlo fácilmente, un modelo mecánico subyacente para tomar un taxi en Nueva York que produzca la misma distribución de probabilidades ¿Ok? Y así lo que voy a hacer es… voy a decir que la probabilidad de conseguir un taxi en Nueva York es constante e independiente del tiempo. Y en particular, la probabilidad de conseguir un taxi en cualquier intervalo de un minuto es "p" "p" es algún numero Eso significa que la probabilidad de que consiga un taxi entre 0 y 1 minutos es "p" la probabilidad de que consiga un taxi entre 1 y 2 minutos, bien, primero que nada, es 1 menos p, porque no consiguió un taxi en ese primer minuto, ok, no tuvo suerte, y entonces la probabilidad de que ok, no habiendo conseguido un taxi en el primer minuto, conseguirá un taxi en el segundo minuto. Ok, es solo "p" ¿Ok? Así… o mas bien, "p(0)" es "p". La probabilidad de conseguir una taxi entre 0 y menos que 1 minuto es "p". "p(1)" es 1 menos "p" por "p". Y claro "p(2)" es solo 1 menos "p" al cuadrado por "p" No lo consiguió en el primer minuto No lo consiguió en el segundo, finalmente lo consigue en el tercero. ¿Ok? Entonces esto de aquí es un modelo mecánico ¿Ok? Y al menos tiene alguna teoría sobre taxis en Nueva York, asume que son como gotas de lluvia, como que cayeran del cielo… Independientes unos de los otros. Y claro, puede graficar este modelo aquí, que en general se ve como P(x) es igual a 1 menos p a la x, por p. Y si defino Z como 1/p Y defino lambda 1 como el menos logaritmo de 1 menos p. Entonces tengo una equivalencia exacta entre estos dos modelos. Así que lo que acabamos de demostrar es que el modelo de máxima entropía, donde el tiempo de espera promedio esta restringido a un valor en particular, pero los demás aspectos del sistema son inciertos, es equivalente a un modelo de llegada aleatoria como gotas de lluvia ¿Ok? Y lo que haremos por el resto de la clase es hablar un poco acerca de como este mecanismo agnóstico, puede ser transformado en un grupo de suposiciones acerca de los principios subyacentes, principios científicos subyacentes que pueden estar actuando, Y en particular aquí es un poco excesivo llamarlo principio científico, pero esencialmente la historia es que… los servicios de transporte privados en Nueva York se pueden conseguir de manera no correlacionada entre ellos y constante en el tiempo ¿Ok? Y puede ver que, claro, si espera demasiado tiempo, tal vez el periodo del día cambia, tal vez otras características del sistema cambian, Así que este "p" puede cambiar, en cuyo caso, este modelo de aquí dejaría de tener la misma forma funcional que el modelo de máxima entropía ¿Ok? Y puede ver de eso como fenómenos mecánicos adicionales pueden alejar el sistema de simple modelo de restricciones de máxima entropía. ¿Ok?