En las 3 unidades previas, hemos cubierto, primeramente, un recuento matemático de cómo modelar el tiempo de llegada de los taxis en Nueva York, y después traté de generalizar y dar un sentido de cómo los métodos de máxima entropía se usan en el mundo real, en particular, cómo se usan o se podrían usar para describir el ecosistema de código abierto. Lo hice como analogía de un grupo de trabajo fundacional hecho por gente en el estudio de ecosistemas. Y mostré cómo, por ejemplo, el modelo de máxima entropía podría estar en tensión con un modelo mecanicista más simple y actualmente no tenemos la capacidad de distinguir entre las dos formas funcionales. MaxEnt preduce una forma funcional. La probabilidad acumulativa mecanicista, ¿Ok? probabilidad acumulativa multiplicativa de lenguaje disuasorio tiene una forma funcional ligeramente diferente y nos parece similar para decidir ahora mismo. En la próxima parte de la charla o la próxima parte de la unidad, voy a tratar de mostraros otro tipo de argumento que se realiza sobre los sistemas sociales y biológicos. En este caso, por supuesto, un sistema social. Y os voy a mostrar cómo estos argumentos se pueden realizar en un formato MaxEnt, y el tipo de conocimiento que seríais capaces de derivar. Así que esta es una historia que se centra en una parte realmente interesante de Americana, el catálogo Sears-Roebuck. Así que la compañía Sears-Roebuck inventó, al menos en Estados Unidos, la idea de vender grandes cantidades de mercancías, no directamente en el almacén, sino mediante un catálogo impreso que era distribuido por el país. Así que, si fuérais granjeros en el otoño de 1909, no teníais necesariamente la posibilidad de ir a Chicago a comprar las cosas que necesitais comprar conseguir agujas e hilo imperdibles y látigos, y máquinas de afeitar Remington. En su lugar, loque haríais es consultar el catálogo de Sears-Roebuck & Co. y podías ordenar, por correo, todas las cosas que necesitabas, y ésto revolucionó, por supuesto, la forma de comprar, una forma de Amazon Prime o Amazon.com de principios del siglo XX. De hecho, el catálogo Sears & Roebuck funcionó antes, desde los años 1800, o finales de 1800, continuamente hasta finales del siglo XX, a finales del siglo XX. Todavía puede existir hoy de alguna forma comprar cosas por correo de un catálogo impreso ha decaído en cierta medida. Así que voy a hablar en particular sobre un artículo que fue escrito en 1981 por Elliott Montroll, llamado "Sobre la Función de Entropía en los Sistemas Socio-Técnicos" y es interesante, en parte, porque es una de las primeras veces que alguien trató de construir un argumento sobre sistemas sociales, sobre sistemas vivos, usando argumentos de Máxima Entropía. Así que ésto es lo que Montroll hizo. Montroll se fijó en los precios de los productos en el catálogoSears-Roebuck. ¿Ok? Y, de hecho, tomó los datos de otra fuente. Y lo que representó aquí fue año por año. Ésto es 1916. Ésto es 1924. Ésto es 1974 Y lo que hace, representa la distribución de precios, la probabilidad de que un artículo en el catálogo Sears tenga algún coste c. Ésto se representa en una escala logarítmica Ésto es el logaritmo del precio, y, de hecho, usa el logaritmo en base 2 y ésto varía de -6, o sea 1/64, hasta +6: 64$ en el caso de 1916, Y representa la distribución de productos. Aquí, por ejemplo, hay una probabilidad del 60% de obtener un producto del catálogo Sears de 1916 al azar que cueste aproximadamente Log en base 2 dólares de 0, o en otras palabras, cueste alrededor de 1$. Así que, 60% de los artículos del catálogo cuestan 1$ y podéis ver que en los extremos, la distribución se extingue. Hay muy pocos artículos que cuesten más de 60$ y muy pocos que cuestan del orden de céntimos. Así que lo primero que nota es que esta distribución parece más o menos Gausiana, o normal. Y si prestásteis atención a la unidad previa, os dísteis cuenta de que ésto es el logaritmo del precio. De hecho, la distribución de precios en el catálogo Sears es log-normal. En otras palabras, si tomáis el logaritmo del precio y mostrais la distribución, tenéis una distribución gausiana. Así que vamos a profundizar en la distrubicón log-normal. ¿Ok? Parece que P de x es proporcional a e elevado a menos (x menos mu) al cuadrado partido por 2 sigma al cuadrado. LLamé a mu a la esperanza de x. Mu es el promedio de la distribución. Recordad la media. Y sigma es algo a lo que llamamos varianza. Vamos a expandirlo un poco más. Voy a escribir esto como e elevado a menos x al cuadrado partido por 2 sigma al cuadrado más 2 mu partido por 2 sigma al cuadrado menos mu al cuadrado partido por 2 sigma al cuadrado. Lo que he hecho es expandir el término x menos mu al cuadrado partido por sigma al cuadrado. Así que lo voy a reescribir como e elevado a menos lambda-1 al cuadrado más lamba-2 x más lambda-3. Y cuando lo escribo de esta forma os dais cuenta de que la distribución log-normal es justo la distribución de máxima entropía si restringimos por dos cosas. Uno: restringimos x al cuadrado. Y el otro: restringimos x. y por supuesto, restringir por ambos es equivalente a restringir por la varianza, que es x menos la esperanza del valor de x al cuadrado y la media. Restringir ésto es equivalente a restringir estos dos. Y, por supuesto, podéis expandir ésto. Y fijando ésto y ésto a un grupo de valores es lo mismo que fijar ésto a un valor y ésto a otro valor. Así que la distribución log-normal es, en secreto, y ha sido secretamente junto con ella, otra distribución MaxEnt. Una vez lo escribís así, y os dais cuenta que estos tipos de constantes... aquí y aquí, estas constantes son realmente multiplicadores de Lagrange que la gente resuelve para encontrar la respuesta. Os dais cuenta que la distribución log-normal restringe estas dos cantidades.