O mundo real é mais complicado do que os modelos teóricos. E quando se estuda um objeto devemos tratá-lo como uma caixa preta, pois não podemos ver por trás ou dentro dele. Pode ser o cérebro ou um computador. Tomemos como exemplo um avião: um artefato feito pelo homem, para o qual temos diagramas exatos para todas as partes. Podemos entender o básico sobre como ele voa mas dificilmente uma única pessoa saberia em detalhes a maneira pela qual milhões de componentes funcionam conjuntamente em um avião como um Boing 474 típico, por exemplo, com cerca de 6 milhões de peças. Em vez disso, os fabricantes especializam-se em diferentes peças e em diferentes aspectos de sua montagem. Assim, até os engenheiros na Boeing e Airbus precisam ver os aviões como caixas pretas, e isso com uma coisa que nós, seres humanos, projetamos e fabricamos sozinhos. A situação é ainda mais complicada com coisas que a natureza desenvolveu e com as quais temos menos histórico compartilhado ou não participamos de seu projeto, como em organismos biológicos. Até fenômenos naturais, como clima e dinâmica de líquidos, revelam-se extremamente difíceis de modelar ou prever. Isto é porque sempre temos um ponto de vista muito parcial. Nos impressionamos com a quantidade de interações envolvidas. Não podemos isolá-las facilmente de todas as outras coisas e em todos os níveis possíveis. É por isso que precisamos sempre lidar com ruído aparente e dados incompletos e o porquê da necessidade de aprender a modelar sistemas complexos com nossas melhores ferramentas. Uma forma de lidar com tal complexidade é tentar entender um sistema por meio de simulação. Neste processo de modelagem, a primeira etapa é entender a utilidade e também as limitações de realizar uma observação. Vou mostrar-lhes um caso extremamente simplificado que consiste de um sistema desconhecido por trás de uma caixa preta. Tipicamente o que ocorre é o observador estar em uma extremidade do sistema, que pode ser identificada como a saída do sistema. Então, digamos que a entrada do sistema é identificada por uma variável x e começamos com a entrada número 1. Podemos então ver o que ocorre na extremidade de saída. Para esta caixa preta, a saída é o número 1/ Quando fazermos o mesmo com o número 2, e depois 3 e assim por diante, observamos que após algumas tentativas, para cada entrada, o que quer que esteja por trás, atribui a mesma saída. Assim, um bom palpite é achar que por trás da caixa preta existe o que chamamos de função identidade. É uma função que recupera a mesma entrada como saída. E na verdade, quando tornamos a caixa transparente, vemos que isso é a função identidade, ao menos para a faixa traçada entre 0 e 10. É diferente de escolher outra função para a qual as entradas correspondam a saídas mais sofisticadas. Para função 2, por exemplo, parece que para cada entrada a saída é a entrada +1, e para a função 3 parece que para cada entrada a saída é o dobro da entrada. Pode-se ver ainda como uma entrada pode, na realidade, ser uma entrada induzida, um experimento ou uma perturbação para o sistema é como atirar uma pedra em algo para ver como reage. Aqui neste exemplo matemático o que jogamos são números. Começamos com certa ordem: número 1, seguido pelo 2 e assim por diante. Observe, no entanto, que por trás da caixa preta pode haver uma função que parece ser a mesma, mas produz as saídas de uma forma bem mais confusa. Digamos, adicionando um número aleatório e subtraindo esse mesmo número novamente, comportando-se como a função identidade mas não sendo exatamente a função identidade típica, ocultando assim seu mecanismo operacional real. Então, uma pergunta relevante é o que nos faz pensar que a função por detrás é mesmo a versão mais simples da função identidade? Isto é, que não havia uma máquina de Rube Goldberg por trás fingindo calcular a função identidade mas de uma maneira incrivelmente tola. Portanto, não podemos ter certeza absoluta de que a função é a função identidade por trás da caixa preta sem abri-la. Nem mesmo que ela seja uma função matemática. Ela só parece ser na série dada, semelhante ao problema do cisne negro em estatística, onde se pode ver o resultado, mas não de onde ou como esses cisnes estão vindo, isto é, o mecanismo gerador. Além disso, podemos observar é que seguimos uma ordem na sequência de saída, mas as observações poderiam ter sido feitas ao acaso e poderíamos ter suposto a mesma função que está por detrás. No entanto, nem sempre é tão simples. E assim que temos casos ligeiramente mais complicados como função 4 e 5 por exemplo, é muito mais complicado estabelecer a relação entre perturbações no eixo do x e as observações testemunhadas no eixo do y. Pode-se chamar a sequência de observações de uma amostra do comportamento da função. Isto é obviamente ainda mais difícil no mundo real porque normalmente não temos ideia das magnitudes das possíveis entradas nem se existe alguma ordem necessariamente privilegiada. Mas você pode ver como poderia parecer a entrada para um organismo biológico. Por exemplo, isso poderia ser comer ou beber, tomar um medicamento. Todas estas podem ser entradas, assim como aprender ou ler pode ser considerado entrada para a mente. Então, quão informativo uma única ou uma coleção de observações podem ser para produzir um modelo razoável com algum grau de confiança? Em outras palavras, de que tipo e quantas observações deveremos realizar para decidir se a função por trás da caixa preta é a que corresponde a nossa hipótese? Quantos pares de entradas e saídas são suficentes ou adequados para se inferir uma função subjacente? Isso é uma propriedade do observador ou do observado? Veremos que a quantidade e a qualidade do experimento depende tanto das condições do experimento quanto das capacidades do observador. Vejamos esta função sigmoide É uma representação do funcionamento de um neurônio porque existe um curto intervalo, chamado limiar, que uma vez alcançado, aumenta radicalmente o comportamento de saída do sistema. Dois fatores nos permitem, ou impedem, de juntar informações suficientes sobre o sistema, para inferir corretamente a função. São eles: quanto ruído existe no ambiente e quão precisas são as nossas medidas? Observe que esses dois fatores podem não ser independentes e um pode interferir no outro. Por exemplo, má capacidade de medição pareceria ruído e ruído pareceria imprecisão das medições É por isso que, tradicionalmente as ferramentas são calibradas em experimentos controlados para se verificar até que ponto são boas e usá-las em casos mais complicados. Agora, neste exemplo, o que podemos ver são algumas caixas grandes para cima e para baixo da função sigmoide representada pela linha branca. Essas caixas representam como uma medida pode estar ao redor do valor real da função para uma entrada no eixo do x quando há ruído ou imprecisões nas medidas e como é o aspecto das medidas e observações no eixo do y. Se essas caixas forem muito grandes os valores começam a se sobrepor impedindo-nos de fazer suposições sobre a função por detrás. Quanto menor o erro, melhor e mais rápida a suposição da função geradora, Observe que quando as barras de erro em amarelo são muito grandes, a média, indicada por uma pequena linha horizontal branca dentro das barras irá convergir para o verdadeiro valor da função ilustrando como o maior número de observações e medições aumenta as chances de se achar o mecanismo gerador por detrás. Embora medidas isoladas, indicadas pelos pontos vermelhos no eixo do y, sejam altamente enganosas, isto mostra que aumentar o número de amostras aumenta a exatidão da previsão Isto está relacionado ao que se conhece como lei dos grandes números, um princípio de probabilidade, segundo o qual a média dos resultados de um grande número de testes deverá estar próximo do valor esperado e tenderá a tornar-se mais perto conforme se realizam mais testes. Um teste significa repetir o mesmo valor de entrada várias vezes, o que, embora o sistema por detrás seja completamente determinístico e até as barras de erro também sejam fixas os valores de saída vão diferir, mas sua média irá convergir para o verdadeiro valor. Um teste às vezes também é chamado de replicação. Outra observação interessante é que as barras de erro podem ser de comprimentos diferentes e até depender do local em que estão ao longo da função. Neste caso as barras de erro são aproximadamente de tamanho similar e não dependem da forma da função. O tipo de ruído que introduzem é chamado aditivo e linear, mas existem casos mais complicados. A relação entre ruído e número de amostas é, portanto, proporcional: quanto maior o ruído, maior o número de amostras necessárias, quanto menor a magnitude do ruído, menor o número de amostras necessárias. Vamos ver como essa área da teoria da informação pode nos ajudar a fazer essas escolhas e tomar essas decisões. O que é mais interessante nesses exemplos é que não importa o quão simplificados , eles ilustram como tudo pode ser estudado de modo similar. Sempre existe uma entrada e uma saida em um sistema de interesse, até em áreas como biologia e cognição como veremos depois, no último módulo. Por exemplo, uma entrada pode ser um medicamento e a saída a evolução de uma doença. Uma entrada pode ser uma proteína oculta e a saída a forma como ela se dobrou. Uma entrada pode ser o acúmulo de nuvens e a saída é se chove ou não. Observe também que entradas geralmente são saída de outro sistema e saídas geralmente são entrada para outro sistemas. Portanto, cada aspecto desses exemplos está relacionados a causalidade. No próximo segmento, veremos como podemos estudar esses sistemas introduzindo computação no estudo da causação.