Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
disciplinas:ce071-2014-01 [2014/04/07 18:39] walmes |
disciplinas:ce071-2014-01 [2014/06/17 14:46] (atual) walmes |
||
---|---|---|---|
Linha 1: | Linha 1: | ||
====== CE-071: Análise de Regressão Linear ====== | ====== CE-071: Análise de Regressão Linear ====== | ||
+ | |||
+ | <WRAP center round important 60%> | ||
+ | <fs large><fc #FF0000>EXAME FINAL</fc> no dia 16/07, 19h00 no LABEST. | ||
+ | Todo o conteúdo da disciplina. | ||
+ | O aluno pode usar computador próprio. | ||
+ | </fs> | ||
+ | </WRAP> | ||
{{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} | {{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} | ||
Linha 20: | Linha 27: | ||
{{url>http://www.leg.ufpr.br/~walmes/ensino/ce071-2014-01/ 800px, 600px center}} | {{url>http://www.leg.ufpr.br/~walmes/ensino/ce071-2014-01/ 800px, 600px center}} | ||
- | ==== Histórico das Aulas do Curso ==== | + | /* ==== Histórico das Aulas do Curso ==== */ |
+ | /* | ||
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. | Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. | ||
- 10/02: | - 10/02: | ||
Linha 64: | Linha 71: | ||
* Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio; | * Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio; | ||
* Especificação e testes de hipóteses entre modelos aninhados. | * Especificação e testes de hipóteses entre modelos aninhados. | ||
- | - 31/03 | + | - 31/03: |
- | - 02/04 | + | * Ajuste do modelo e previsão de valores; |
- | - 07/04 | + | * Intervalos de confiança e intervalos de predição. |
- | - 09/04 | + | - 02/04: |
- | - 14/04 | + | * Análise dos pressupostos do modelo; |
- | - 16/04 | + | * Medidas de influência; |
- | - 21/04 | + | * Tipos de resíduos (crus, padronizados, studentizados); |
- | - 23/04 | + | * DFfits, DFbetas e distância de Cook; |
- | - 28/04 | + | - 07/04: |
- | - 30/04 | + | * Análise dos resíduos e medidas de influência; |
- | - 05/05 | + | * Prática de regressão linear múltipla com o R; |
- | - 07/05 | + | * Estudo sobre o preço de relógios antigos; |
- | - 12/05 | + | * Estudo sobre o salário de trabalhadores sociais. |
- | - 14/05 | + | - 09/04: |
- | - 19/05 | + | * Medidas de colinearidade; |
- | - 21/05 | + | * Fator de inflação da variância. |
- | - 26/05 | + | - 14/04: |
- | - 28/05 | + | * Polinômios ortogonais; |
- | - 02/06 | + | * Centralização das variáveis; |
- | - 04/06 | + | * Prática de regressão linear múltipla com o R; |
- | - 09/06 | + | * Estudo sobre nível de ddt em peixes; |
- | - 11/06 | + | * Estudo sobre o gasto em consumo de alimentos por família. |
- | - 16/06 | + | - 16/04: |
- | - 18/06 | + | * Seleção de variáveis; |
- | - 23/06 | + | * Seleção forward, backwad e stepwise baseados em critérios de informação (AIC e BIC); |
- | - 25/06 | + | - 23/04: |
+ | * Prática de regressão linear múltipla com o R; | ||
+ | * Estudo sobre a qualidade de vinhos; | ||
+ | * Estudo sobre o salario de executivos. | ||
+ | - 28/04: | ||
+ | * Variáveis categóricas no modelo de regressão; | ||
+ | * Estudo das interações. | ||
+ | - 07/05: | ||
+ | * Introdução aos modelos de regressão não linear; | ||
+ | * Aspectos motivacionais práticos e diferenças para o modelo linear; | ||
+ | * Especificação, ajuste, diagnóstico e interpretação. | ||
+ | - 12/05: | ||
+ | * Regiões de confiança em modelos de regressão; | ||
+ | * Relações entre a região de confiança e a matriz de covariância dos parâmetros; | ||
+ | * Tipos de testes: razão de verossimilhanças e Wald; | ||
+ | * Tipos de intervalo de confiança: baseados na verossilhança e de Wald. | ||
+ | - 14/05: | ||
+ | * Teste de hipótese; | ||
+ | * Bandas de confiança; | ||
+ | * Medidas de diagnóstico. | ||
+ | - 19/05: | ||
+ | * Ajuste de modelos não lineares com variáveis independentes categórias. | ||
+ | - 21/05: | ||
+ | * Comparação de modelos não lineares; | ||
+ | * Parametrizações. | ||
+ | - 02/06: | ||
+ | * Apresentação de seminários. | ||
+ | - 04/06: | ||
+ | * Apresentação de seminários. | ||
+ | */ | ||
==== Links úteis ==== | ==== Links úteis ==== | ||
+ | === Cursos, dados e scripts sobre Regressão Linear === | ||
* {{http://www.ats.ucla.edu/stat/sas/examples/chp/|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts; | * {{http://www.ats.ucla.edu/stat/sas/examples/chp/|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts; | ||
* {{http://www.ats.ucla.edu/stat/sas/examples/chp/chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt; | * {{http://www.ats.ucla.edu/stat/sas/examples/chp/chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt; | ||
Linha 99: | Linha 136: | ||
* {{http://www.stat.ufl.edu/~winner/Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$; | * {{http://www.stat.ufl.edu/~winner/Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$; | ||
+ | === Cartões de referência === | ||
* {{http://www2.kenyon.edu/Depts/Math/hartlaub/Math305%20Fall2011/R.htm|Resumo de comandos R e pacotes para regressão}}; | * {{http://www2.kenyon.edu/Depts/Math/hartlaub/Math305%20Fall2011/R.htm|Resumo de comandos R e pacotes para regressão}}; | ||
* {{http://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf|Cartão de referência para regressão}}; | * {{http://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf|Cartão de referência para regressão}}; | ||
+ | === Medidas de diagnóstico === | ||
* {{http://www.stats.ox.ac.uk/~burke/Linear%20Models/Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}}; | * {{http://www.stats.ox.ac.uk/~burke/Linear%20Models/Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}}; | ||
* {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Slides de medidas de diagnóstico}}; | * {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Slides de medidas de diagnóstico}}; | ||
Linha 107: | Linha 146: | ||
* {{http://courses.washington.edu/b515/l7.pdf|Exemplos de diagnóstico}}; | * {{http://courses.washington.edu/b515/l7.pdf|Exemplos de diagnóstico}}; | ||
* {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}} | * {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}} | ||
+ | |||
+ | === Regressão com variáveis categóricas === | ||
+ | * {{http://www.sagepub.com/upm-data/21120_Chapter_7.pdf|Dummy-Variable Regression}}; | ||
+ | * {{http://gauss.stat.su.se/gu/e/slides/F6-Dummy-Variable.pdf|Dummy variable regression models}}; | ||
+ | * {{http://socserv.socsci.mcmaster.ca/jfox/Courses/SPIDA/dummy-regression-notes.pdf|Dummy-Variable Regression}}; | ||
+ | * {{https://www.princeton.edu/~slynch/soc504/expanding_ols.pdf|Expanding the Model Capabilities: Dummy Variables, Interactions, and Nonlinear Transformations}}. | ||
==== Avaliações ==== | ==== Avaliações ==== | ||
Linha 149: | Linha 194: | ||
* Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes. | * Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes. | ||
- | * Verificar que E(\hat\beta) = \beta, var(\hat\beta) = \sigma^2(X'X)^{-1}, e que \hat\betas têm distribuição Normal. | + | * Verificar que <latex>E(\hat\beta) = \beta</latex>, <latex>var(\hat\beta) = \sigma^2(X'X)^{-1}</latex>, e que <latex>\hat\betas</latex> têm distribuição Normal. |
- | * Verificar que E(\hat\sigma^2) = \sigma^2 e que (n-p)*\hat\sigma/\sigma têm distribuição qui-quadrado. | + | * Verificar que <latex>E(\hat\sigma^2) = \sigma^2</latex> e que <latex>(n-p)*\hat\sigma/\sigma<\latex> têm distribuição qui-quadrado. |
- | * Verificar que F = (A\hat\beta-m)'[A(X'X)^{-1}A']^{-1}(A\hat\beta-m)/(r QMRes) têm distribuição F sob H0 que A\betas = m. | + | * Verificar que <latex>F = (A\hat\beta-m)'[A(X'X)^{-1}A']^{-1}(A\hat\beta-m)/(r QMRes)</latex> têm distribuição F sob H0 que <latex>A\betas = m</latex>. |
* Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior. | * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior. | ||
* Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14. | * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14. | ||
Linha 173: | Linha 218: | ||
* DFfits, DFbetas; | * DFfits, DFbetas; | ||
* As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas; | * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas; | ||
+ | |||
+ | * Alavancagem | ||
+ | <latex> | ||
+ | h_i = H_{ii}\\ | ||
+ | h = \text{diag}(H) = \text{diag}(X(X^\top X)^{-1}X^\top)\\ | ||
+ | </latex> | ||
* Resíduos crus | * Resíduos crus | ||
<latex> | <latex> | ||
e_i = y_i - \hat{y}_i\\ | e_i = y_i - \hat{y}_i\\ | ||
- | e = y - \hat{y} | + | e = y - \hat{y}\\ |
e = y - X\hat{\beta} | e = y - X\hat{\beta} | ||
</latex> | </latex> | ||
+ | * Resíduos padronizados (ou internamente studentizados) | ||
+ | <latex> | ||
+ | r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}\sqrt{1-h_{i}}} | ||
+ | </latex> | ||
- | </code> | + | * Resíduos studentizados (ou externamente studentizados) |
+ | <latex> | ||
+ | t_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}_{-i}\sqrt{1-h_{i}}}\\ | ||
+ | \hat{\sigma}_{-i}^2 = \dfrac{(n-p)\hat{\sigma}^2-\frac{e_i^2}{1-h_{i}}}{(n-1)-p} | ||
+ | </latex> | ||
- | <code R> | + | * Distância de Cook |
- | ##----------------------------------------------------------------------------- | + | <latex> |
+ | D_i = \dfrac{(\hat{y}-\hat{y}_{i(-i)})^\top (\hat{y}-\hat{y}_{i(-i)})}{p\hat{\sigma}^2} = | ||
+ | \dfrac{1}{p}\cdot\dfrac{h_i}{(1-h_i)}\cdot\dfrac{e_i^2}{\hat{\sigma}^2(1-h_i)} | ||
+ | </latex> | ||
- | require(car) | + | * DFfits |
+ | <latex> | ||
+ | dffits_i = \dfrac{\hat{y}_i-\hat{y}_{i(-i))}}{\hat{\sigma}_{-i}\sqrt{h_i}} = t_i\left( \dfrac{h_i}{1-h_i} \right )^{1/2} | ||
+ | </latex> | ||
- | ##----------------------------------------------------------------------------- | + | * DFbetas |
- | ## Dados sobre o preço de leitão (price) de relógios antigos (do avô) em | + | <latex> |
- | ## função da idade do relógio (age) e do número de potenciais | + | dbetas_i = \dfrac{\hat{\beta}-\hat{\beta}_{-i}}{\hat{\sigma}_{-i}\sqrt{\text{diag}((X^\top X)^{-1})}}\\ |
- | ## compradores (bidders). | + | \hat{\beta}_{-i} = \hat{\beta}-\dfrac{e_i}{1-h_i}\cdot (X^\top X)^{-1} x_i |
+ | </latex> | ||
- | da <- | + | === Trabalho 4 === |
- | read.table("http://www.leg.ufpr.br/~walmes/data/business_economics_dataset/EXAMPLES/GFCLOCKA.DAT", | + | |
- | header=FALSE) | + | |
- | str(da) | + | * Análise de dados por meio de regressão com presença de variáveis independentes categóricas; |
- | + | * Os dados e contexto são exercício do capítulo 6 do *Applied Linear Regression* 3.ed do Weisberg; | |
- | ## Essa coluna removida é o produto de age*bidders | + | * Fazer a análise dos dados fornecendo o contexto e objetivos do mesmo, declarar o modelo, correr análise dos resíduos, interpretar os resultados, fazer a predição com bandas de confiança; |
- | da <- da[,-4] | + | * Entregar *.zip o pdf, Rnw e arquivos acessórios; |
- | + | * Prazo de entrega: 12/05/2014 até às 23h59; | |
- | names(da) <- c("age", "bidders", "price") | + | |
- | str(da) | + | |
+ | <code R> | ||
##----------------------------------------------------------------------------- | ##----------------------------------------------------------------------------- | ||
- | ## Dados sobre o salário em função dos anos de experiência de uma | + | str(twins) ## 6.4. Eduardo. |
- | ## amostra de trabalhadores sociais. | + | str(BGSall) ## 6.6. Michele. |
- | + | str(cathedral) ## 6.10. Paula. | |
- | db <- | + | str(salary) ## 6.13. Cintia. |
- | read.table("http://www.leg.ufpr.br/~walmes/data/business_economics_dataset/EXAMPLES/SOCWORK.DAT", | + | str(mile) ## 6.18. Gustavo. |
- | header=FALSE) | + | |
- | + | ||
- | names(db) <- c("yrsexp", "salary") | + | |
##----------------------------------------------------------------------------- | ##----------------------------------------------------------------------------- | ||
</code> | </code> |