A informação que se tem sobre uma quantidade de interesse é fundamental na Estatística. O verdadeiro valor de é desconhecido e a idéia é tentar reduzir este desconhecimento. Além disso, a intensidade da incerteza a respeito de pode assumir diferentes graus. Do ponto de vista Bayesiano, estes diferentes graus de incerteza são representados através de modelos probabilísticos para . Neste contexto, é natural que diferentes pesquisadores possam ter diferentes graus de incerteza sobre (especificando modelos distintos). Sendo assim, não existe nenhuma distinção entre quantidades observáveis e os parâmetros de um modelo estatístico, todos são considerados quantidades aleatórias.
Considere uma quantidade de interesse desconhecida (tipicamente não observável). A informação de que dispomos sobre , resumida probabilisticamente através de , pode ser aumentada observando-se uma quantidade aleatória relacionada com . A distribuição amostral define esta relação. A idéia de que após observar a quantidade de informação sobre aumenta é bastante intuitiva e o teorema de Bayes é a regra de atualização utilizada para quantificar este aumento de informação,
Para um valor fixo de , a função
fornece a
plausibilidade ou verossimilhança de cada um dos
possíveis valores de enquanto é chamada
distribuição a priori de . Estas duas fontes de
informação, priori e verossimilhança, são combinadas levando à
distribuição a posteriori de ,
. Assim, a
forma usual do teorema de Bayes é
(1.2) |
Note que, ao omitir o termo , a igualdade em (1.1) foi substituída por uma proporcionalidade. Esta forma simplificada do teorema de Bayes será útil em problemas que envolvam estimação de parâmetros já que o denominador é apenas uma constante normalizadora. Em outras situações, como seleção de modelos, este termo tem um papel crucial.
É intuitivo também que a probabilidade a posteriori de um particular conjunto de valores de será pequena se ou for pequena para este conjunto. Em particular, se atribuirmos probabilidade a priori igual a zero para um conjunto de valores de então a probabilidade a posteriori será zero qualquer que seja a amostra observada.
A constante normalizadora da posteriori pode ser facilmente recuperada pois onde
Se, após observar , estamos interessados na previsão de uma
quantidade , também relacionada com , e descrita
probabilisticamente por
então
Fica claro também que os conceitos de priori e posteriori
são relativos àquela observação que está sendo considerada no
momento. Assim,
é a posteriori de em relação a
(que já foi observado) mas é a priori de em relação a (que não foi observado ainda). Após observar uma nova
posteriori (relativa a e ) é obtida aplicando-se novamente o
teorema de Bayes. Mas será que esta posteriori final depende da ordem em
que as observações e foram processadas? Observando-se as
quantidades
, independentes dado e
relacionadas a através de
segue que
(Gamerman e Migon, 1993) Um médico, ao examinar uma pessoa, `` desconfia'' que ela possa ter uma certa doença. Baseado na sua experiência, no seu conhecimento sobre esta doença e nas informações dadas pelo paciente ele assume que a probabilidade do paciente ter a doença é 0,7. Aqui a quantidade de interesse desconhecida é o indicador de doença
É bem intuitivo que a probabilidade de doença deve ter aumentado após este resultado e a questão aqui é quantificar este aumento. Usando o teorema de Bayes segue que
Agora o médico aplica outro teste cujo resultado está relacionado a através da seguinte distribuição
O resultado deste teste foi negativo (). Neste caso, é também
intuitivo que a probabilidade de doença deve ter diminuido e esta redução será quantificada por uma nova aplicação do teorema de Bayes,
Verifique como a probabilidade de doença se alterou ao longo do experimento
Um outro resultado importante ocorre quando se tem uma única observação da distribuição normal com média desconhecida. Se a média tiver priori normal então os parâmetros da posteriori são obtidos de uma forma bastante intuitiva.
Note que, definindo precisão como o inverso da variância, segue do teorema que a precisão a posteriori é a soma das precisões a priori e da verossimilhança e não depende de . Interpretando precisão como uma medida de informação e definindo então mede a informação relativa contida na priori com respeito à informação total. Podemos escrever então que
(Box & Tiao, 1992) Os físicos e desejam determinar uma constante física . O físico tem mais experiência nesta área e especifica sua priori como . O físico tem pouca experiência e especifica uma priori muito mais incerta em relação à posição de , . Assim, não é difícil verificar que
Faz-se então uma medição de em laboratório com um aparelho calibrado com distribuição amostral e observou-se . Aplicando o teorema 1.1 segue que
Note também que os aumentos nas precisões a posteriori em relação às precisões a priori foram,
A situação está representada graficamente na Figura 1.1 a seguir. Note como a distribuição a posteriori representa um compromisso entre a distribuição a priori e a verossimilhança. Além disso, como as incertezas iniciais são bem diferentes o mesmo experimento fornece muito pouca informação adicional para o físico enquanto que a incerteza do físico foi bastante reduzida.
O exemplo a seguir (DeGroot, 1970, páginas 165 e 166) ilustra esta propriedade. Imagine que cada item de uma população de itens manufaturados pode ser classificado como defeituoso ou não defeituoso. A proporção de itens defeituosos na população é desconhecida e uma amostra de itens será selecionada de acordo com um dos seguintes métodos:
Qualquer que tenha sido o esquema amostral, se foram inspecionados itens dos quais eram defeituosos então
O Princípio da Verossimilhança postula que para fazer inferência sobre uma quantidade de interesse só importa aquilo que foi realmente observado e não aquilo que `` poderia'' ter ocorrido mas efetivamente não ocorreu.
(a) Que proporção dos itens serão classificados como suspeitos ? (b) Qual a probabilidade de um item classificado como suspeito ser defeituoso ? (c) Outro teste, que classifica dos itens defeituosos e dos itens bons como defeituosos, é aplicado somente aos itens suspeitos. (d) Que proporção de itens terão a suspeita de defeito confirmada ? (e) Qual a probabilidade de um item reprovado neste teste ser defeituoso ?