Raciocínio Bayesiano

Por Tom Siegfried

Retirado de:

Odds Are, It’s Wrong Science fails to face the shortcomings of statistics

ScienceNews March 27th, 2010; Vol.177 #7 (p. 26)

Disponível online em:

Odds Are, It's Wrong

Os métodos bayesianos iniciaram na análise estatística a partir de um artigo publicado postumamente em 1763 pelo pastor inglês Thomas Bayes. Em uma análise Bayesiana, cálculos de probabilidade requerem um valor prévio para a probabilidade de uma associação, que depois é modificado após os dados serem recolhidos. Quando a probabilidade prévia não é conhecida, deve ser estimada, levando a críticas de que as suposições subjetivas frequentemente devem ser incorporadas ao que deveria ser uma análise científica objetiva. Mas sem essa estimativa, estatísticas podem produzir conclusões grosseiramente imprecisas.

Para um exemplo simplificado, considere o uso de testes de drogas para detectar uso de esteróides em esportistas. Suponha que o teste para o uso de esteróides entre os jogadores de beisebol é 95 por cento exato - ou seja, ele identifica corretamente reais usuários de esteróides 95 por cento do tempo, e classifica erroneamente não-usuários como usuários 5 por cento do tempo.

Suponha que um teste feito num jogador anônimo tenha dado positivo. Qual é a probabilidade de que ele realmente está usando esteróides? Como o teste é realmente preciso de 95 por cento do tempo, a resposta de que a probabilidade de culpa é de 95 por cento seria ingênua. Mas uma Bayesiano sabe que essa conclusão não pode ser tirada apenas desse teste. Você precisa saber alguns fatos adicionais não incluídos nesta prova. Neste caso, você precisa saber que muitos jogadores de beisebol usam esteróides para começar - o que seria o que um Bayesiano chamaria a probabilidade prévia.

Agora, suponha que, com base em ensaios anteriores, os peritos verificaram que cerca de 5 por cento dos jogadores de beisebol profissionais usam esteróides. Agora, suponha que você testa 400 jogadores. Quantos testes dariam positivo?

Desses 400 jogadores, 20 são usuários (5 por cento) e 380 não são usuários.

Dos 20 usuários, 19 (95 por cento) seriam identificados corretamente como usuários.

Dos 380 não-usuários, 19 (5 por cento) seriam identificados incorretamente como usuários.

Portanto, se você testou 400 jogadores, 38 testes seriam positivos. Destes, 19 usuários seriam culpados e 19 seriam inocentes não-usuários. Assim, se um único teste de um jogador é positivo, as chances de que ele realmente é um usuário são de 50 por cento, pois o número de testes positivos é igual para usuários e não usuários.