Usualmente, analisa-se a relação entre pares de variáveis. Por exemplo, a pergunta:
``Qual é a probabilidade de que um hospital selecionado aleatóriamente do Sul tenha 50-99 camas?''
implica que se tem interesse na associação entre tamanho do hospital e região geográfica.
Genéricamente, discuste-se a probabilidade da variável sempre que a variável
. Isto é uma probabilidade condicional. Suponha que
para todo
e
para todo
, tem-se que:
O termo é chamado probabilidade conjunta de A e B e os termos no
denominador são denominados probabilidades marginais porque
Independência é uma forma estatística de especificar que duas variáveis são
não relacionadas. Variáveis são ditas independentes sempre a seguinte propriedade
seja válida para todo e
:
Note que se e
sãi independentes,
e
.
Se um hospital é selecionado ao acaso, a probabilidade de selecionar um hospital do
Oeste com menos de 50 camas é
.
Uma questão interessante é se e
são independentes. Como
A Tabela 1.4 mostra algumas distribuições condicionais.
Região | ||||||
Nordeste | Centro-Norte | Sul | Oeste | Total | ||
Tamanho | Parâmetro | (1) | (2) | (3) | (4) | (5) |
6-49 | ![]() |
0.063 | 0.255 | 0.475 | 0.208 | 1 |
![]() |
0.188 | 0.318 | 0.519 | 0.488 | 0.438 | |
50-99 | ![]() |
0.157 | 0.254 | 0.391 | 0.198 | 1 |
![]() |
0.254 | 0.226 | 0.232 | 0.252 | 0.237 | |
100-199 | ![]() |
0.209 | 0.290 | 0.344 | 0.157 | 1 |
![]() |
0.251 | 0.192 | 0.152 | 0.149 | 0.177 | |
200-299 | ![]() |
0.310 | 0.266 | 0.267 | 0.157 | 1 |
![]() |
0.165 | 0.078 | 0.052 | 0.066 | 0.078 | |
300+ | ![]() |
0.295 | 0.329 | 0.258 | 0.118 | 1 |
![]() |
0.141 | 0.086 | 0.045 | 0.045 | 0.070 | |
Total | 0.147 | 0.267 | 0.400 | 0.186 | - | |
1 | 1 | 1 | 1 |
A probabilidade condicional do menor hospital ser do Sul é 1679/3537=0.475.
De forma análoga, a probabilidade de um hospital do Oeste ter 300 ou mais camas é 67/1503=0.045.
A terminologia fica então mais clara: