Ahora voy a repasar todos los pasos
que seguimos

¿Ok? Porque hemos hecho un viaje largo

y han aprendido un gran numero de cosas

en la búsqueda de resolver este problema,

que al final es un problema simple,

El problema que quería resolver ¿Ok?

Era una descripción breve de
cuanto tiempo toma

conseguir un taxi en
la cuidad de Nueva York ¿Ok?

Y esa descripción breve quería

deducirla usando los datos

Así que, las cosas que son extensas

son decir que la probabilidad de esperar

n minutos es el numero de veces que se

encontró esperando n minutos por un taxi

Esa clase de descripciones decidimos que

son demasiado...
Se sobre-ajustan a los datos.

¿Ok? En cambio,

lo que vamos a hacer es
vamos a intentar reproducir

un numero limitado de características.

No vamos a intentar reproducir,
por ejemplo,

el numero exacto de veces que
esperamos 6 minutos, ¿Ok?

O la fracción exacta de veces
que esperamos 6 minutos

En cambio, lo que vamos a hacer es
reproducir

algunas características básicas
de los datos.

En particular, lo que dije fue

"¿Sabes que? Lo único que quiero preservar

es el promedio del tiempo
que toma conseguir un taxi"

Eso es todo, olvide todo lo demás

Ahora el problema es que

hay muchas distribuciones que cumplen
esta condición

Así que lo que decidimos hacer es

tomar la distribución que
tenia la máxima entropía

sujeta a estar restricciones ¿Ok?

Y la razón que dimos era que

la distribución con máxima entropía

lo deja con la misma incertidumbre
sobre el tiempo de espera

¿Ok? No tiene teorías ocultas adicionales.

No hay manera de que implícitamente

pueda asumir algo mas acerca
de los datos que pueda reducir

su incertidumbre acerca
de lo que va a pasar

¿Ok? Así que, ese era nuestro argumento...

Ese era ma o menos nuestra...

Justificación intuitiva para
este paso de aquí,

para maximizar la entropía.

Antes usted creía que era bueno hacerlo,
luego profundizamos en la matemática,

en particular, lo que tenia que hacer
era mostrarle como funciona el método

de los multiplicadores de Lagrange.

Esta es una gran herramienta matemática,

es útil no solo en el
problema de máxima entropía,

si no que lo vera en todos lados,

en particular en áreas como la economía

¿Ok? donde el objetivo, de hecho,

sus multiplicadores de Lagrange se llaman

"Precios Fantasma" ¿Ok? Pero, en esos...

En muchos sistemas donde
lo que trata de hacer es

maximizar una cantidad,

pero esta limitado por
otro conjunto de restricciones

Le mostré como hacer el truco de
multiplicadores de Lagrange

Le di... le di el problema bidimensional
con una restricción

y le dije que el problema
con restricción final

parece o funciona de manera similar ¿Ok?

Y después yo en realidad resolví
el problema de maximizar restricciones

de maximizar la entropía sujeta
a estas restricciones

y encontramos una
forma funcional en particular

que era solo una forma funcional.

Era solo una forma funcional porque

lambda y Z, estas eran los términos 
ocultos de los

multiplicadores de Lagrange, estos eran 
términos que tuve que fijar a mano.

Así que conozco el
funcional inmediatamente,

pero, ahora tengo que hacer
el trabajo duro

de determinar cuanto deben
valer lambda y Z.

Y entonces, tuve que hacer
algunas sumas infinitas,

jugar algunos juegos matemáticos,
espero que se divirtieran,

y al final, lo que hemos encontrado es que

para estos multiplicadores de Lagrange

obtenemos una ecuación trascendental
para Lambda 1.

Mientras no veían, rápidamente introduje
esto en Mathematica

y encontré el valor numérico de Lambda 1

que es aproximadamente igual a 0.22

Así que, al terminar todo esto,

si esto es 
0 minutos, 1, 2, 3, 4, 5, 6, 7...

Esto es el tiempo de espera en minutos,

esta es la probabilidad de esperar
esos minutos.

Entonces en los datos,
tenemos... Usted sabe,

algunas veces esperamos 6 minutos,
algunas veces, veamos, 3 minutos,

algunas veces esperamos 4 minutos,

un par de veces esperamos 2 ¿Ok?

Así que, esta es la distribución de los
datos que habíamos medido... ¿Bien?

Este es el que hubiéramos decido que
es un modelo "sobre ajustado".

Y de hecho, lo que encontramos es que

la distribución es parecida a esta,
es una distribución exponencial, en x.

¿Ok? Entonces, esto de aquí,
es en cierto sentido

el modelo que mejor se ajusta a esto
si estuviera desprovisto… si… si… si…

Si fijar el valor medio del tiempo
de espera fuera la única restricción.

Y esto de aquí, con esta particular
elección de restricciones para los

multiplicadores de Lagrange, acierta en
el promedio y nada mas.

La incertidumbre es máxima.

No es que esto no tenga otras propiedades,

por ejemplo, su distribución tiene
una varianza.

Pero son todas dependientes,

todas son escogidas de forma tal
que la distribución de aquí tenga

la máxima entropía sujeta a una
restricción solo en el promedio.

Así que, vamos a pensar
brevemente sobre este modelo,

que por cierto, es mecánicamente
agnóstico ¿Bien?

No tiene teoría acerba de los taxis,

en cualquier parte pudimos, en cambio de
modelar el tiempo de espera para taxi,

modelar el tiempo de espera para… No se,
usted sabe, su próximo vuelo de United,

bien, pudimos modelar, usted sabe,
el numero de… usted sabe,

el numero de terremotos en Japón
en un año de cierta magnitud.

Pudimos modelar el numero de, usted sabe,
C+ que da a los estudiantes

en un año en particular ¿Ok?

Esta metodología es
completamente agnóstica

con respecto a la física subyacente,
o ciencia cognitiva,

o sociología del problema ¿Ok?

Pero vamos a mirar y observar si hay
algún modelo mecánico implícito

que el principio de máxima entropía
nos a dado implícitamente.

En particular, vamos a
ver si podemos construir,

y seremos capases de hacerlo fácilmente,
un modelo mecánico subyacente

para tomar un taxi en Nueva York que

produzca la misma distribución
de probabilidades ¿Ok?

Y así lo que voy a hacer es…
voy a decir que la probabilidad de

conseguir un taxi en Nueva York es
constante e independiente del tiempo.

Y en particular, la probabilidad de
conseguir un taxi en

cualquier intervalo de un minuto es "p"

"p" es algún numero

Eso significa que la probabilidad de que
consiga un taxi entre 0 y 1 minutos es "p"

la probabilidad de que consiga un taxi
entre 1 y 2 minutos, bien,

primero que nada, es 1 menos p, porque
no consiguió un taxi en ese primer minuto,

ok, no tuvo suerte, y entonces

la probabilidad de que

ok, no habiendo conseguido un taxi en el
primer minuto, conseguirá un taxi en

el segundo minuto. Ok, es solo "p"

¿Ok? Así… o mas bien, "p(0)" es "p".

La probabilidad de conseguir una taxi

entre 0 y menos que 1 minuto es "p".

"p(1)" es 1 menos "p" por "p".

Y claro "p(2)" es solo
1 menos "p" al cuadrado por "p"

No lo consiguió en el primer minuto

No lo consiguió en el segundo,

finalmente lo consigue en el tercero.

¿Ok? Entonces esto de aquí es un
modelo mecánico ¿Ok?

Y al menos tiene alguna teoría sobre taxis
en Nueva York,

asume que son como gotas de lluvia,
como que cayeran del cielo…

Independientes unos de los otros.

Y claro, puede graficar este modelo aquí,
que en general se ve como

P(x) es igual a 1 menos p a la x, por p.

Y si defino Z como 1/p

Y defino lambda 1 como el menos logaritmo
de 1 menos p.

Entonces tengo una equivalencia exacta
entre estos dos modelos.

Así que lo que acabamos de demostrar es
que el modelo de máxima entropía,

donde el tiempo de espera promedio
esta restringido a un valor en particular,

pero los demás aspectos
del sistema son inciertos,

es equivalente a un modelo de llegada
aleatoria como gotas de lluvia ¿Ok?

Y lo que haremos por el resto de la clase
es hablar un poco acerca de como

este mecanismo agnóstico,

puede ser transformado en
un grupo de suposiciones

acerca de los principios subyacentes,

principios científicos subyacentes
que pueden estar actuando,

Y en particular aquí es un poco excesivo
llamarlo principio científico,

pero esencialmente la historia es que…

los servicios de transporte privados
en Nueva York

se pueden conseguir de manera
no correlacionada entre ellos

y constante en el tiempo ¿Ok?

Y puede ver que, claro, si espera
demasiado tiempo,

tal vez el periodo del día cambia,

tal vez otras características
del sistema cambian,

Así que este "p" puede cambiar,

en cuyo caso, este modelo de aquí
dejaría de tener la misma forma funcional

que el modelo de máxima entropía ¿Ok?

Y puede ver de eso como
fenómenos mecánicos adicionales

pueden alejar el sistema de simple modelo
de restricciones de máxima entropía.

¿Ok?