====== CE-003 Turma AMB/K/O - Primeiro semestre de 2014 ====== No quadro abaixo será anotado o conteúdo dado em cada aula do curso. \\ São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas, bem como os exercícios sugeridos. Veja ainda depois da tabela as **Atividades Complementares**. \\ **Referências**\\ * **B & M**: BUSSAB, W.O. & MORETTIN, P.A. (2010) Estatística Básica. **6a Edição**, Editora Saraiva * **WEB** [[http://onlinestatbook.com/2/index.html|Online Statistics: An Interactive Multimedia Course of Study]]: Material online sobre estatística **Observação sobre exercícios recomendados** os exercícios indicados são compatíveis com o nível e conteúdo do curso. \\ Se não puder fazer todos, escolha alguns entre os indicados. ===== Conteúdos das Aulas ===== ^ ^^ B & M ^^ Online ^ ^ Data ^ Conteúdo ^ Leitura ^ Exercícios ^ Tópico ^ | 10/02 Seg |Informações sobre o curso. Percepções e aplicações da estatística. |Cap 1 | -- | [[#10/02|Ver abaixo]] | | PARTE I: PROBABILIDADES ^^^^^ | 12/02 Qua |Fundamentos das três partes deste curso: (i) probabilidades, (ii) estatística descritiva e (iii) inferência estatística.Informações sobre o curso. Percepções e aplicações da estatística. Introdução a probabilidades: definições e conceitos básicos. Experimentos aleatórios, eventos, espaços amostrais, espaços de probabilidades, definições de probabilidades. Propriedades. |Cap 5, 5.1, 5.2 |Cap 5: 1 a 14 | | | 17/02 Seg |Probabilidades (cont). Exemplos. Probabilidade Condicional, Independência |Cap 5: 5.3 |Cap 5: 15 a 22 | [[#17/02|Ver abaixo]] | | 19/02 Qua |Probabilidades (cont). Teorema de Bayes. Exemplos e exercícios. O problema dos aniversários, o problema de Monty Hall. Códigos e uso de simulações para estimar probabilidades. |Cap 5: 5.5 a 5.6 |Cap 5: 23 a 25 | | | 24/02 Qua |1a avaliação semanal. Probabilidades (cont). Exemplos e introdução a variáveis aleatórias (discretas). Distribuições binomial, binomial negativa (Pascal) e geométrica |Cap 6: 6.1, 6.2, 6.6 (6.6.1, 6.6.2, 6.6.3) |Cap 6: 1 a 5, 20 e 21, 57 | | | 03/03 Seg |Feriado Carnaval | | | | 05/03 Qua |Feriado Carnaval | | | | 10/03 Seg |2a avaliação semanal. Revisão e continuação - Distribuições discretas de probabilidade: Binomial, Hipergeométrica, Geométrica, Pascal (Bin. Negativa), Uniforme, Multinomial e Poisson (+ processo de Poisson) |Cap 6, Sec 6.6 e 6.7 |Cap 6: 20 a 28, 31 a 38 | | 12/03 Qua |Valor esperado, variância, distribuição acumulada e quantis de variáveis discretas. Exercícios. |Cap 6: 6.3, 6.4, 6.5 e 6.8. |Cap 6: 7 a 19, 29, 30, 39, 40 | | 17/03 Seg |3a avaliação semanal. Introdução a v.a. contínuas. |Cap 7: 7.1 e 7.2 |Cap 7: 1 a 4 | | 19/03 Seg |v.a. contínuas. Cálculo de probabilidades, esperança (média), mediana e quantis (quartis, decis, percentis etc), função acumulada |Cap 7: 7.1, 7.2, 7.3, 7.8 |Cap 7: 5 a 12 (exceto 11) | | 24/03 Seg |4a avaliação semanal. Casos especiais de v.a. contínuas. Uniforme e exponencial. A ideia de utilizar outras distribuições e as formas de cálculo de probabilidades |Cap 7.4: 7.4.1, 7.4.3, 7.7 |Cap 7: 13, 21, 28, 29, 31 | | 26/03 Qua |v.a. contínuas: distribuição normal |Cap 7.4: 7.4.2 |Cap 7: 14 a 20, 34 a 38 | | 31/03 Seg |v.a. contínuas: distribuição normal (cont) |Cap 7.4: 7.4.2 |Cap 7: 14 a 20, 34 a 38 | | 02/04 Qua |1a prova |Cap 5, 6 e 7 | | | 07/04 Seg |Outras v.a's contínuas (Beta, Gama, Weibull, t, etc). Convergência e aproximação normal à Binomial e Poisson. Transformação de variáveis. Introdução a estatística descritiva: uni e bi(multi)variada, tipos de variáveis (qualitativa: nominal e ordinal, quantitativa: discreta e contínua) |Cap 7: 7.5, 7.6 e 7.7. Cap 2: 2.1, 2.2 e 2.3 |Cap: 7: 25, 26, 39. |[[#07/04|Ver abaixo]] | | 09/04 Qua |Estatística descritiva. Exemplos e interpretações de gráficos, tabelas e medidas. Gráficos: barras (1 e 2 variáveis), histogramas, histogramas suavizados, ramo-e-folhas, //box-plot// |Cap 1-3 | | | 14/04 Seg |sem aula presencial | | | | 16/04 Qua |Avaliação semanal. Medidas estatísticas - medidas de posição, dispersão, assimetria e curtose. Dados atípicos |Cap 3 |Cap 3: 1 a 41 | [[#16/04|Ver abaixo]] | | 21/04 Seg |feriado - Tiradentes | | | | 23/04 Qua |análises descritivas bi-dimensionais. gráficos, tabelas e medidas de associação |Cap 4 |Cap 4: 1 a 15. |[[http://onlinestatbook.com/2/describing_bivariate_data/bivariate.html|Material online]]: \\ Describing Bivariate Data | | 28/04 Seg |Avaliação semanal. Introdução a inferência estatística |Cap 10 | | | 30/04 Seg |Inferência estatística |Cap 10 |Cap 10: 1, 3, 7 a 13 |[[#30/04|Ver abaixo]] códigos utilizados na aula | | 05/05 Seg |Avaliação semanal. Discussão sobre a avaliação e esquemas de amostragem. Inferência estatística |Cap 10 |Cap 10: 21 a 28 |[[#30/04|Ver abaixo]] códigos utilizados na aula | | 07/05 Seg |Distribuições amostrais, intervalos de confiança e cálculo de tamanho de amostra. Métodos de estimação: momentos, mínimos quadrados e máxima verossimilhança |Cap 11 |Cap 11: 7, 8, 12, 13 | | | 12/05 Seg |Avaliação semanal. Discussão sobre a avaliação e outras distribuições amostrais (variância, diferença de médias de duas populações e variâncias de duas populações) |Cap 11 |Cap 11: 14 a 21 |[[http://onlinestatbook.com/stat_sim/sampling_dist/|Material online para revisão]] | | 14/05 Qua |Outras distribuições amostrais e resultados delas derivados. Intervalos de confiança. Exemplos e exercícios. |Cap 11 |Cap 11: 27, 29, 30 | | | 19/05 Seg |Avaliação semanal. | | | | | 21/05 Qua |sem aula presencial | | | | | 26/05 Seg |Testes estatísticos de hipótese. Testes aleatorizados e baseados em distribuições amostras teóricas. Fundamentos, passos e interpretações. Exemplos. |Cap 12 |Cap 12: 6 a 12 | | | 28/05 Qua |Testes de hipótese (cont). Mais exemplos, tipo de erros e nível descrivico (valor-p) |Cap 12: 1 a 5, 16, 17, 19, 20, 22, 24, 25, 28 a 35, 38, 39 | | | | 02/06 Qua |Testes de hipótese (cont): testes para duas amostras. Comentários sobre transformação de dados, testes não paramétricos e aleatorizados. Testes de aderência e chi-quadrado de independência. |Cap 13 e 14 |Cap 13: 5 a 9, 16, 19, 20 a 34 | | === 10/02 === * Pesquisar exemplos de aplicações de estatística na sociedade em geral e em sua área de interesse. Trazer para discussão em sala * Assistir e debater o vídeo: Educação estatística e sua importância: uma opinião em apenas 3 minutos! ([[http://www.ted.com/talks/lang/eng/arthur_benjamin_s_formula_for_changing_math_education.html|Um vídeo rápido para reflexão]]) === 17/02 === * Resolver o problema dos aniversários: Considere uma turma de 30 alunos, qual a probabilidade de haver uma coincidência qualquer de aniversários neste grupo? Quantos pessoas são necessárias no grupo para que esta probabilidade ultrapasse 0,50? - **Problemas para discussão:** - Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas: * apenas sabendo que eles tem duas crianças * depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc) * você encontra os amigos e eles estão com uma das crianças com eles que é uma menina === 19/02 === - Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A paga R$ 1,00 para B. Se a soma for par, B paga R$ 1,00 para A. * quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores? * quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores? * o jogo é honesto? - Considere os problemas a seguir e resolva cada uma deles de duas formas: * Solução formal (analítica) * Solução (aproximada) por alguma rotina computacional - Um comitê de 12 pessoas é escolhido por sorteio de um grupo de 100 pessoas. Calcule a probabilidade dos indivíduos **A** e **B** pertencerem ao grupo escolhido. - Um baralho de 52 cartas contém 4 cartas do tipo //ás//. Se as cartas são embaralhadas e 13 cartas são divididas entre 4 indivíduos, qual a probabilidade de que algum deles fique com todas as cartas //ás//. - Se //n// pessoas terão seus assentos atribuídos ao acaso em uma linha com //2n// assentos, qual a probabilidade que não haja pessoas em assentos adjacentes? - **Agulha de Buffon**: procurar sobre o problema da agulha de Buffon e programar em alguma linguagem de sua escolha. Portar o código na página Espaço Aberto do curso. Verificar a relação do problema com as definições de probabilidades. - Assista o vídeo a seguir, relaciona com os temas discutidos em aula, reflita, discuta com os colegas e/ou em sala. * [[http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html|Peter Donelly]] no TED Talks - como estatística e probabilidade podem ser usadas e ... abusadas * ** note que voce pode habilitar legendas em inglês, português ou outras línguas, se desejar ** * ** procure anotar as principais mensagens da apresentação ** * ** se voce tivesse que destacar a descrever 2 (dois) pontos principais da apresentação, quais seriam? ** === 07/04 === - Veja [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/|no link exemplos de análises uni e bivariadas]] para um conjunto de dados em B&M === 16/04 === - Fazer uma pesquisa sobre o conceito e usos de médias geométrica e harmônica. === 30/04 ===


##
## Exemplo 1:
##
## definindo uma pequena população 
POP1 <- c(34, 45, 28, 29, 35, 38, 41, 36, 33, 40)
POP1
## tamanho da amostra:
n <- 3
## uma amostra
(am1 <- sample(POP1, size=n))
## estatísticas
(t1 <- mean(am1))
(t2 <- min(am1))
(t3 <- diff(range(am1)))
(t4 <- (min(am1) + max(am1))/2)

## outra amostra
(am2 <- sample(POP1, size=n))
## estatísticas
mean(am2)
min(am2)
diff(range(am2))
(min(am2) + max(am2))/2

## PARAMETRO
(theta1 <- mean(POP1))

## estimadores: 
## das estatistica acima: t1 e t4 são possíveis estimadores para theta1

##
## Exemplo 2:
##
## definindo uma população "grande" 
POP2 <- round(rbeta(1000000, 6, 9)*100, dig=1)
THETA <- mean(POP2)
## tamanho de amostra
n <- 20
## uma amostra
(am1 <- sample(POP2, size=n))
(t1 <- mean(am1))
## obtendo agora 10 amostra e as estimaticas em cada uma delas:
(ams <- replicate(10, sample(POP2, size=n)))
apply(ams, 2, mean)

## 10 amostras agora de tamanho 50. as estimativas variam menos
ams50 <- replicate(10, sample(POP2, size=50))
apply(ams50, 2, mean)

## agora 500 amostras de tamanho 20
## as estimativas formam a "distribuição amostral"
ams <- replicate(500, sample(POP2, size=n))
mds <- apply(ams, 2, mean)
mean(mds)
hist(mds, prob=T)
lines(density(mds))
## ... e 500 amostras de tamanho 50
ams50 <- replicate(500, sample(POP2, size=50))
mds50 <- apply(ams50, 2, mean)
mean(mds50)
hist(mds50, prob=T)
lines(density(mds50))
curve(dnorm(x, m=mean(POP2), sd=sd(POP2)/sqrt(50)), from=30, to=50, col=2, add=T)

## qual estimador? no exemplo t1 t4
## pode-se comparar caracteristicas das distribuições amostrais para escolher
## o estimador mais eficiente (menos variabilidade)

## para o t1
plot(density(mds))
minmax <- apply(ams, 2, function(x) (min(x) + max(x))/2)
## para o t4
mean(minmax)
lines(density(minmax), col=2)


## Na prática se utiliza apenas uma amostra.
## Em certos casos (como média amostral)
## a distribuição amostral pode ser obtida por resultados teóricos
##

## distribuições amostrais obtidas: por multiplas amostras e teórica
plot(density(mds))
curve(dnorm(x, m=mean(POP2), sd=sd(POP2)/sqrt(20)), from=30, to=50, col=2, add=T)

## decisão baseada na distribuição amostral
## os valores abaixo seriam considerados "incompatíveis" com a distribuição
abline(v=38)
abline(v=32)


## Exemplo 3:
## Simulando uma pesquisa eleitoral
## para intencao de voto de um unico candidato

## armazenando o valor (populacional e desconhecido) da intenção de voto
set.seed(123456)
THETA <- runif(1, 0, 1)

## tirando uma amostra de tamanhos 2500 
am <- sample(c(0,1), size=2500, prob=c(1-THETA, THETA), rep=T) 
## estimativa baseada na amostra
(est <- mean(am))

## Margem de erro (baseada na distribuição amostra "teórica"
(ME <- 1.96 * sqrt((est*(1-est))/2500))

##
curve(dnorm(x, m=est, sd=sqrt((est*(1-est))/2500)), from=0.75, to=0.85)
abline(v=est)
abline(v=est + c(-1, 1)*ME, lty=2)
abline(v=THETA, col=2)

## margem de erro "conservadora" (usando theta=0,5 na expressão da variancia do estimador)
(MEcons <- 1.96 * sqrt(1/(4*2500)))