Olá e bem-vindo à unidade 5. Esta unidade é sobre distribuições empíricas que apresentam lei de potência. Nossa questão central será: suponha que esteja estudando algum fenômeno e possui um conjunto de dados. Como poderá determinar se esses dados são bem descritos por uma lei de potência? E se sim, qual a melhor forma de estimar o expoente da lei de potência? Temos que essas perguntas podem ser surpreendentemente sutis e é fácil encara-las de modo errado. Irei iniciar no próximo subitem olhando formas diferentes de representar dados. Então falaremos sobre histogramas, mas também sobre funções de distribuição acumulada e gráficos de ranking de frequência Eu, então, darei uma breve passada por alguns fenômenos que parecem ser distribuidos de acordo com leis de potência e depois começaremos a olhar algumas dessas questões de inferência. Dado que suspeitemos que algo seja uma lei de potência, qual a melhor forma de estimar os parâmetros que descrevem a distribuição? Também precisamos conversar sobre alternativas, por isto eu quero dizer que possam haver outras distribuições que descrevem seus dados melhor que uma lei de potência e há algumas distribuições que são regularmente confundidas por leis de potência, particularmente funções KWW e log-normal. Então o que farei será dizer um pouco sobre estas outras distribuições, e comparar e contrastar elas às com leis de potência, e depois falar sobre algumas técnicas estatísticas para escolher entre estas várias opções. Antes de começar, direi mais uma palavra sobre esta unidade. Irei frequentemente me referir a dois artigos chaves em leis de potência empíricas e inferência com leis de potência e eu coloquei uma lista desses artigos junto a links para os pdfs em um subitem ou numa seção denominada Additional Resources [Recursos Adicionais] Então, poderá encontrar todos os artigos que eu menciono lá, então não deverá ter problemas de encontrá-los. Adicionalmente, estarei mencionando um monte de técnicas estatísticas e não vamos ficar tão envolvidos neles que eu irei mostrar o passo a passo de como utiliza-los. Eu acho que isso é demasiada estatística e além da abrangência desse curso, porém suspeito, espero que alguns de vocês queiram tentar essas coisas por conta própria. Então, existem bons softwares por ai que tem sido desenvolvido por volta dos últimos 5 anos e links para esses softwares também se encontram nessa seção de recursos adicionais. Tem alguns códigos de Python, de R, e um pouco de Matlab também. Portanto, se quiser tentar algumas coisas esses são lugares muitos bons de começar. Ok, vamos começar por pensar em distribuições de lei de potências olhando como representar os dados. E irei fazer isso com um exemplo simples que irá nos levar para a construção de uma função de distribuição acumulada e de um gráfico de ranking de frequência Irá ver que é mais fácil de calcular do que de falar. Então, vamos nessa!