O que é o teorema
de Bayes, regra essencial da informática criada para 'provar milagres'
P(A|B) =
(P(B|A)P(A))/P(B)
Certamente
a frase acima não é a maneira mais comum nem a mais clara de iniciar uma
reportagem. É disso, no entanto, que vamos falar aqui. Algo que, como diz o
título deste texto, está ligado à informática e a milagres.
Trata-se
do teorema de Bayes. Ainda que muitos de nós não tenhamos ouvido falar dele, as
estatísticas bayesianas permearam tudo, da física - com interpretações
bayesianas da mecânica quântica e defesas bayesianas das teorias de cordas e do
multiverso - às pesquisas sobre câncer e covid, passando por ecologia,
filosofia, neurologia, psicologia, além da informática.
Há
até cientistas cognitivos que consideraram que nossos cérebros incorporam
algoritmos bayesianos ao perceber, deliberar e tomar decisões. Apaixonados pelo
teorema dizem que, se adotarmos o raciocínio bayesiano consciente (mais além do
processamento bayesiano inconsciente, que nosso cérebro supostamente emprega),
o mundo seria melhor.
Diante
disso tudo, vale a pena saber um pouco sobre essa fórmula com que começamos
este texto e seu autor.
"Ele
foi parte de uma geração que não pôde frequentar as universidades de Oxford ou
Cambridge, as principais universidades inglesas da época, porque ele não era da
Igreja da Inglaterra."
"Isso
foi uma sorte para Bayes, porque ele foi para o norte da Escócia, que era
presbiteriana e tinha uma universidade muito melhor em Edimburgo na época. Ali,
ele estudou teologia, como seu padre, e matemática, que era seu verdadeiro
interesse, e se tornou um matemático aficionado."
Bayes
conseguiu mesclar seus dois interesses, escreveu ao menos um livro sobre
matemática e passou grande parte de seu tempo estudando as obras de outros
matemáticos e teólogos. E, assim, começou a desenvolver uma ideia.
Como
nasceu a ideia
"Foi
durante uma grande polêmica religiosa sobre se era possível usar a evidência do
mundo natural para demonstrar que Deus existe", explica McGrayne.
Um
dos que participaram no debate foi o filósofo David Hume, que publicou, em
1748, o até hoje influente livro Investigação sobre o Conhecimento Humano,
questionando, entre outras coisas, a existência de milagres.
Segundo
Hume, a probabilidade de que as pessoas tivessem afirmado incorretamente que
haviam visto a ressurreição de Jesus superava em muito a probabilidade de que o
fato tivesse ocorrido.
"Um
milagre é uma violação das leis da natureza; e, como uma experiência firme e
inalterável estabeleceu essas leis, a prova contra um milagre, pela mesma
natureza do fato, é tão completa como se pode imaginar que qualquer argumento
baseado na experiência o seja", escreveu o filósofo.
Isso
não caiu bem ao reverendo e, querendo demonstrar que Hume estava equivocado,
começou a tratar de quantificar a probabilidade de um evento imaginando-se
situações como a seguinte:
Imagine
que esteja em uma casa e atrás de você esteja uma mesa. Alguém lança uma bola
que cai sobre essa mesa. Mas, sem olhar, você não tem como saber exatamente
onde.
Então,
você pede a essa pessoa que jogue outra bola e lhe diga se ela caiu à direita
ou à esquerda da primeira. Se caiu à direita, é mais provável que a primeira
tenha sido no lado esquerdo da mesa, pois você supõe que haja mais espaço nesse
lado para a segunda bola ter caído.
A
cada nova bola que é lançada, você pode atualizar sua conjectura e ir
precisando a localização da original. De maneira semelhante, pensou Bayes, os
diversos testemunhos da ressurreição de Cristo indicavam que o acontecimento
não podia ser descartado da forma com que Hume afirmara.
"Ocorreu
a ele um teorema de uma linha realmente simples, que serve para trabalhar com
dados incompletos e disse que tudo bem começar com uma ideia pela metade sobre
uma situação, contanto que você modifique implacavelmente suas ideias iniciais
cada vez que apareça uma nova informação", assinalou McGrayne. "Ele
nos deu um raciocínio matemático para situações altamente incertas."
A
rejeição
Bayes
não publicou seu teorema, mas um amigo seu, Richard Price, um matemático
aficionado, o desenvolveu e, em 1767, publicou Sobre a Importância do
Cristianismo, suas Evidências e as Objeções que lhe Foram Feitas, em que usou
as ideias de Bayes para desafiar o argumento de Hume.
"O
ponto probabilístico básico" de Price, diz o historiador e estatístico
Stephen Stigler em seu artigo O Verdadeiro Título do Ensaio de Bayes, "foi
que Hume subestimou o impacto de que havia vários testemunhos independentes de
um milagre, e os resultados de Bayes mostraram como a multiplicação de
evidências, inclusive as falíveis, poderia fortalecer a grande improbabilidade
de um acontecimento e estabelecê-lo como um fato".
Não
foi suficiente para Price provar a existência dos milagres, mas ele deu
visibilidade a algo que de outra forma teria ficado oculto entre os papeis de
Bayes, que nessa época já havia morrido.
O
teorema caiu no esquecimento até que o ilustre matemático francês Pierre Simon
Laplace formalizou a visão de Bayes e mostrou claramente como se podia
aplicá-la no início do século 19.
A
partir de então, entrou e saiu de moda. Foi aplicado em uma ciência atrás da
outra apenas para logo ser condenado por ser vago, subjetivo e pouco
científico. Converteu-se, então, no pomo da discórdia entre campos rivais de
matemáticos antes de desfrutar de um renascimento nos últimos anos.
Por
que o teorema voltou?
Lembre-se
que o enfoque bayesiano diz que você pode começar com uma estimativa subjetiva
de uma probabilidade, qualquer probabilidade, independentemente de haver algum
dado.
Qual
a probabilidade de que Deus exista? O novo coronavírus sofrerá alguma mutação
que inutilize as vacinas? Qual é a possibilidade de uma guerra nuclear antes de
1º de janeiro de 2030?
Tendo
começado com aquilo que é pouco mais que uma suposição, usamos a regra de Bayes
para revisar nossa opinião à medida que chegam novos dados. John Stuart Mill, o
filósofo e economista político britânico do século 19, chamou o teorema de
"a ignorância cunhada na ciência".
Durante
muito tempo, o enfoque bayesiano foi tabu nas estatísticas convencionais, mas
não morreu. Ao longo das décadas, pessoas inteligentes encontraram maneiras
inteligentes de aplicá-lo.
Um
caso surpreendente: o teorema de Bayes foi utilizado por Alan Turing enquanto
ele trabalhava com sua equipe decifrando o código Enigma usado pelos submarinos
alemães, os U-Boot, durante a Segunda Guerra Mundial.
"Nesse
momento, os submarinos saíam da França e recebiam ordens por rádio sobre aonde
ir e o que fazer, e essas ordens eram em uma linguagem codificada chamada
Enigma. E a frota alemã fez esse código tão complicado que ninguém no Reino
Unido nem na Alemanha acreditavam que os britânicos pudessem decifrá-lo",
lembra McGrayne.
Turing,
porém, estava determinado a fazê-lo, aproveitando tudo que pudesse. "Eles
conheciam a organização geral de uma oração em alemão. Perceberam que usavam a
palavra ein (1 em alemão) em quase todas as mensagens, assim que houvesse três
letras. Essa foi uma pista. Assim continuaram, adicionando mais e mais
dados."
Turing
e seus colegas criaram um sistema bayesiano para adivinhar um conjunto de
letras em uma mensagem do Enigma, medir sua confiança na validade dessas
conjecturas usando métodos bayesianos para avaliar as probabilidades e agregar
mais pistas à medida que chegavam. Com o tempo, puderam ler as mensagens."
Quando
os fatos mudam...
Assim,
o teorema foi utilizado por muitas outras pessoas. Uma vez que chegaram os
computadores, seu uso disparou.
Para
dar uma ideia de como ele funciona, responda a esta pergunta: se você obtiver
um resultado positivo em um teste de covid-19 que só resulta em falso positivo
uma vez em cada 1 mil, qual é a probabilidade de que realmente tenha o
coronavírus?
Pensou
em 99,9%? Na verdade, a resposta correta é que você não tem informação
suficiente para saber. É aí que entra o teorema de Bayes.
A
notação matemática do teorema, reproduzida no início desta reportagem, parece
complicada. Mas é mais fácil de entendê-la com um exemplo do que decifrando o
significado de todos aqueles símbolos.
Imagine
que você se submete a um exame para detectar uma possível enfermidade. O exame
é incrivelmente preciso: se a pessoa tem a doença, ele dará a resposta correta
em 99% dos casos. Se não tiver, também. Mas a enfermidade em questão é muito
rara; somente uma pessoa em cada 10 mil sofre dessa doença. Isso é conhecido
como sua "probabilidade prévia": o índice na população.
Agora
imagine que façam o exame em 1 milhão de pessoas. Cem pessoas têm a
enfermidade, e o teste identifica corretamente 99 delas. Existem 999.900
pessoas sem a doença, e a prova identifica corretamente 989.901 delas.
Isso
significa, no entanto, que o exame, apesar de dar a resposta correta em 99% dos
casos, informou a 9.999 pessoas que elas têm a doença, quando na realidade elas
não têm.
Então,
se você obtém um resultado positivo, neste caso, sua probabilidade de ter a
enfermidade é de 99 em 10.098, ou seja, pouco menos de 1%. Sem o enfoque
bayesiano, o resultado inicial assustaria muitas pessoas e as levaria a
procedimentos médicos intrusivos e potencialmente perigosos devido a um
diagnóstico equivocado.
Sem
se conhecer a probabilidade prévia, não se sabe quão provável um resultado é
falso ou verdadeiro.
Esse
não é um problema hipotético. Na medicina, por exemplo, uma revisão de casos
realizada em 2016 identificou que 60% das mulheres que haviam feito mamografias
anualmente durante dez anos tiveram ao menos um resultado falso positivo.
Nos
tribunais de justiça, uma falha conhecida como a "falácia do fiscal",
que pode condenar inocentes, também depende do teorema. E essa é somente a
ponta do iceberg. Pesquisadores utilizam a estatística bayesiana para lidar com
problemas de incrível complexidade.
O
raciocínio bayesiano, combinado com a potência computacional avançada,
revolucionou a busca de planetas que orbitam estrelas distantes. As
estatísticas bayesianas contribuíram para reduzir a idade do Universo, que no
final da década de 1990 era calculado como tendo entre 8 bilhões e 15 bilhões
de anos. Agora foi concluído com certa confiança que ele tem 13,8 bilhões de anos.
"Hoje
em dia, ele é utilizado na genética, para detectar diferenças sutis no DNA e
nas proteínas, assim como para proteger a vida silvestre, fazer estudos
cerebrais, traduzir idiomas estrangeiros…", enumera a autora de A Teoria
que Nunca Morreu. "Ele foi embutido na informática, no aprendizado
automático, na inteligência artificial."
"Pode
ser que não seja exatamente como o fez Bayes, mas ele foi modernizado e é
incrivelmente útil, está em toda parte", afirmou McGrayne na entrevista
com a BBC. Ela concluiu com uma citação já atribuída aos economistas John
Maynard Keynes e Paul Samuelson, assim como ao premiê britânico Winston
Churchill e outros, para resumir a essência do teorema de Bayes: "Quando
os fatos mudam, eu mudo de opinião. Você faz o quê?"
Fonte:
BBC News Mundo
Nenhum comentário:
Postar um comentário