Usualmente, analisa-se a relação entre pares de variáveis. Por exemplo, a pergunta:
``Qual é a probabilidade de que um hospital selecionado aleatóriamente do Sul tenha 50-99 camas?''
implica que se tem interesse na associação entre tamanho do hospital e região geográfica.
Genéricamente, discuste-se a probabilidade da variável sempre que a variável
. Isto é uma probabilidade condicional. Suponha que para todo
e para todo , tem-se que:
O termo é chamado probabilidade conjunta de A e B e os termos no
denominador são denominados probabilidades marginais porque
Independência é uma forma estatística de especificar que duas variáveis são
não relacionadas. Variáveis são ditas independentes sempre a seguinte propriedade
seja válida para todo e :
Note que se e sãi independentes, e .
Se um hospital é selecionado ao acaso, a probabilidade de selecionar um hospital do Oeste com menos de 50 camas é .
Uma questão interessante é se e são independentes. Como
A Tabela 1.4 mostra algumas distribuições condicionais.
Região | ||||||
Nordeste | Centro-Norte | Sul | Oeste | Total | ||
Tamanho | Parâmetro | (1) | (2) | (3) | (4) | (5) |
6-49 | 0.063 | 0.255 | 0.475 | 0.208 | 1 | |
0.188 | 0.318 | 0.519 | 0.488 | 0.438 | ||
50-99 | 0.157 | 0.254 | 0.391 | 0.198 | 1 | |
0.254 | 0.226 | 0.232 | 0.252 | 0.237 | ||
100-199 | 0.209 | 0.290 | 0.344 | 0.157 | 1 | |
0.251 | 0.192 | 0.152 | 0.149 | 0.177 | ||
200-299 | 0.310 | 0.266 | 0.267 | 0.157 | 1 | |
0.165 | 0.078 | 0.052 | 0.066 | 0.078 | ||
300+ | 0.295 | 0.329 | 0.258 | 0.118 | 1 | |
0.141 | 0.086 | 0.045 | 0.045 | 0.070 | ||
Total | 0.147 | 0.267 | 0.400 | 0.186 | - | |
1 | 1 | 1 | 1 |
A probabilidade condicional do menor hospital ser do Sul é 1679/3537=0.475.
De forma análoga, a probabilidade de um hospital do Oeste ter 300 ou mais camas é 67/1503=0.045.
A terminologia fica então mais clara: