====== CE-083: Estatística Computacional I ====== //"The purpose of computing is insight, not numbers."// (Richard Hamming) EXAME FINAL no dia 17/07, 17h30 no LABEST. Todo o conteúdo da disciplina. O aluno pode usar computador próprio. Toda prova será baseada no conjunto de dados de {{http://www.leg.ufpr.br/~walmes/data/euro_football_players.txt|jogadores de futebol da liga européia}}. {{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} ==== Detalhes da oferta da disciplina ==== * Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]]) * Curso: Estatística. * Período: 2014/1. * Local: LABEST, LAB C. * Horário: Terça e Quinta, 17:30-19:00h. * Atendimento: Quinta, 19:00-20:30h. * Cartão de referência: {{http://www.leg.ufpr.br/~walmes/cursoR/guia_rapido_R.pdf|Guia rápido do usuário R}} - tradução por Conrado Oliveira (ex-aluno). * Ementa: {{http://www.leg.ufpr.br/~walmes/ensino/CE083-fichas-2013-05-03.pdf}} ---- ==== Scripts, notas e documentos ==== {{url>http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/ 800px, 600px center}} ---- /* ==== Histórico das Aulas do Curso ==== */ /* Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. - 11/02: * Download e instação do R; * Editores de script; * Primeira sessão com o RStudio; * Operações elementares com escalares; * Salvando script e área de trabalho; - 13/02: * Vetores nomeados; * Regras lógicas; * Seleção a partir de regras lógicas; * Classificação de valores em intervalos; * Sequencias regulares; - 18/02: * Matrizes; * Data frames; - 20/02: * Ordenar vetores e data.frames; * Reordenar e renomear fatores; * Arredondar e truncar números; - 25/02: * Medidas descritivas para uma amostra; * Distribuições de frequência; * Tarefas por grupo/estrato; * Tarefas por margem; - 27/02: * Leitura de dados a partir de aquivos de texto; * Tratamento de valores após leitura; - 11/03: * Download e leitura de dados em aquivos de texto; * Seleção dos carros e cálculo separado de estatísticas descritivas; - 13/03: * Análise descritiva tabular e gráfica; * Tarefas separadas por grupo e por resposta; * Cálculo de múltiplas estatísticas para a amostra; * Exportando gráficos; - 18/03: * Expressões regulares; * Captura de informações por meio de expressões regulares; - 20/03: * Fusão de tabelas de dados por chave comum; * Aglutinar/combinar níveis de fatores. - 25/03: * Revisão de distribuição de probabilidades; * Como fazer funções. - 27/03: * Geração de números aleatórios; * Método da congruência; * Geração de números aleatórios de distribuições discretas de suporte finito; * Método da transformação integral da probabilidade para gerar números aleatórios de outras distribuições. - - 01/04: * Cálculo de probabilidades; * Visualização de distribuições de probabilidade. - 03/04: * Pesquisa reproduzível; * Relatórios dinâmicos com R+Markdown. - 08/04: * Fundamentos de testes de hipótese; * Erros de decisão; - 10/04: * Teste t para a média de uma população; * Teste t para a diferença de médias de duas populações independentes; * Teste t para a diferença de médias de duas populações pareadas. - 15/04: * Teste F para variâncias de duas populações normais; * Teste chi-quadrado para aderência; * Teste chi-quadrado para independência. - 22/04: * Avaliação do desempenho de teste de hipótese com desvio nos pressupostos; * Significância e cobertura nominais via estudo de simulação; * Curva de poder do teste de hipótese. - 24/04 - 29/04 - 01/05 - 06/05 - 08/05 - 13/05 - 15/05 - 20/05 - 22/05 - 27/05 - 29/05 - 03/06 - 05/06 - 10/06 - 12/06 - 17/06 - 19/06 - 24/06 - 26/06 */ ---- ==== Links úteis ==== * {{http://www.rstudio.com/ide/docs/authoring/using_markdown|Usando markdown com o RStudio}}; * {{https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet|Markdown: guia de sintaxe (1)}}; * {{http://support.iawriter.com/help/kb/general-questions/markdown-syntax-reference-guide|Markdown: guia de sintaxe (2)}}; ---- ==== Avaliações ==== === Trabalho 1 - Análise comparativa de modelos de carros === - Cada dupla ou trio deve escolher dois modelos de carros para avaliar (ex: Fiat Palio vs Volkswagen Gol, Renault Clio vs Fiat Uno); - O contexto do trabalho é orientar clientes na escolher entre os modelos de interesse via uma análise exploratória de dados baseada nos dados disponíveis de satisfação dos clientes; - As tabelas sobre a nota dada por donos desses modelos com relação à uma série de características serão extraídos do site [[http://www.carrosnaweb.com.br/|carros na web]] e disponibilizados via arquivo de texto; - Os dados devem ser lidos e uma análise exploratória com emprego de gráficos e tabelas deve ser feita; - A análise deve considerar comparações entre modelos, entre anos de fabricação e as diversas características votadas; - Cada grupo deve entrar no site [[http://www.carrosnaweb.com.br/opiniao.asp]] e consultar seus carros, anotar o número total de páginas de resultados e informar para o acadêmico Milton, responsável por reunir e enviar as informações de cada grupo: nomes dos acadêmicos, marcas, modelos, totais de páginas. - Os grupos e pares de carros a serem comparados seguem na tabela abaixo: ^Acadêmicos^Carros^ |Bruna, Jonivan e Lucas |Gol vs Onix | |Luiz, Maurício e Ana Laura |Gol vs HB20 | |Danilo, Josafa e Francielle |HB20 vs Onix | |Milton, Nathalie e Andressa |Ka vs Celta | |Damiane e Cintia |Punto vs Polo | |Adenmilson |Fluence vs Jetta | | |S-10 vs Ranger | | |Crossfox vs Idea | | |Voyage vs Siena | | |Uno vs Clio | | |Sandero vs Gol | | |Saveiro vs Strada | | |Duster vs Ecosport | | |Focus vs Fluence | | |Fluence vs Cruze | | |J3 vs Agile | | |Punto vs City | | |Logan vs Voyage | | |Bravo vs Focus | - Os arquivos de texto a serem lidos são: - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_nota.txt|Tabela]] com as notas no formato longo; - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_info.csv|Tabela]] como as informações de origem e condição do carro; - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_fwf.txt|Tabela]] com as notas no formato amplo, em comprimento fixo de campo; - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_dic.txt|Tabela]] de dicionário para ler a tabela de comprimento fixo de campo; - Algumas escolhas de carros para comparação foram alteradas por não serem consideradas adequadas. Acadêmicos não listados devem escolher uma das opções disponíveis na tabela. Na aula de terça-feira (11/03) deve-se ler/importar os quarto arquivos fornecidos para download, selecionar/filtrar das tabelas os carros escolhidos e obter estatísticas descritivas para cada carro (tarefas por grupo/margem). Serão avaliados quanto a isso. === Trabalho 2 - Distribuições de probabilidade === - Resolver os exercícios selecionados do livro de {{http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/exerc_bussabmoretin.pdf|Estatística Básica do Bussab e Moretin (5ª edição)}}, destacados com um X vermelho ao lado. Usar o R como calculadora e as funções p, d, q e r dos modelos de probabilidade. - Entregar a solução usando 1) [[http://www.rstudio.com/ide/docs/authoring/using_markdown|R+Markdown]], 2) [[http://cran.r-project.org/web/packages/odfWeave/vignettes/odfWeave.pdf|R+LibreOffice]], 3) [[http://www.r-statistics.com/2010/05/exporting-r-output-to-ms-word-with-r2wd-an-example-session/|R+MSWord]] ou 4) [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula. - Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]]. === Trabalho 3 - Testes de hipótese === - Aplicar cada um dos testes de hipótese abaixo com dados retirados de livros, dados reais, dados disponíveis na internet ou qualquer outra fonte. Evitar dados simulados. * Em medidas de posição: - Teste t para a média de uma v.a. normal; - Teste t para a diferença de médias entre duas v.a. normais por amostras independentes; - Teste t para a diferença de médias entre duas v.a. normais por amostras pareadas; - Teste exato para proporção de uma v.a. binomial; - Teste aproximando pela normal para proporção de uma v.a. binomial; - Teste para a diferença de proporções de duas ou mais v.a. binomiais; - Teste do sinal para a mediana de uma v.a.; - Teste de Wilcox para a diferença de médias de duas v.a. por amostras independentes; - Teste de Wilcox para a diferença de médias de duas v.a. por amostras pareadas; * Em medidas de dispersão: - Teste F para a igualdade de variâncias entre duas v.a. normais; * Aderência: - Teste chi-quadrado para aderência de uma distribuição à uma v.a.; - Teste de Shapiro-Wilk para a normalidade de uma v.a.; - Teste de Kolmogorov-Smirnov para a aderência de uma distribuição à uma v.a.; * Associação: - Teste chi-quadrado para independência de duas v.a. em tabelas de contingência; - Teste de correlação de Pearson entre duas v.a. normais; - Teste de correlação de Spearman entre duas v.a.; - Entregar a solução usando [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula. - Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]]. - Prazo de entrega: 15/05/2014 até às 23h59. {{threads>pessoais:walmes:ce083-2014-01:discussion_tb2}} ~~DISCUSSION~~