Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Próxima revisão Ambos lados da revisão seguinte
disciplinas:ce071-2014-01 [2014/04/07 18:36]
walmes
disciplinas:ce071-2014-01 [2014/04/28 18:01]
walmes
Linha 64: Linha 64:
     * Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio;     * Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio;
     * Especificação e testes de hipóteses entre modelos aninhados.     * Especificação e testes de hipóteses entre modelos aninhados.
-  - 31/03 +  - 31/03
-  - 02/04 +    * Ajuste do modelo e previsão de valores; 
-  - 07/04 +    * Intervalos de confiança e intervalos de predição. 
-  - 09/04 +  - 02/04
-  - 14/04 +    * Análise dos pressupostos do modelo; 
-  - 16/04 +    * Medidas de influência;​ 
-  - 21/04 +    * Tipos de resíduos (crus, padronizados,​ studentizados);​ 
-  - 23/04+    * DFfits, DFbetas e distância de Cook; 
 +  - 07/04
 +    * Análise dos resíduos e medidas de influência;​ 
 +    * Prática de regressão linear múltipla com o R; 
 +    * Estudo sobre o preço de relógios antigos; 
 +    * Estudo sobre o salário de trabalhadores sociais. 
 +  - 09/04
 +    * Medidas de colinearidade;​ 
 +    * Fator de inflação da variância. 
 +  - 14/04
 +    * Polinômios ortogonais;​ 
 +    * Centralização das variáveis;​ 
 +    * Prática de regressão linear múltipla com o R; 
 +    * Estudo sobre nível de ddt em peixes; 
 +    * Estudo sobre o gasto em consumo de alimentos por família. 
 +  - 16/04: 
 +    * Seleção de variáveis;​ 
 +    * Seleção forward, backwad e stepwise baseados em critérios de informação (AIC e BIC); 
 +  - 23/04
 +    * Prática de regressão linear múltipla com o R; 
 +    * Estudo sobre a qualidade de vinhos; 
 +    * Estudo sobre o salario de executivos.
   - 28/04   - 28/04
   - 30/04   - 30/04
Linha 93: Linha 114:
 ==== Links úteis ==== ==== Links úteis ====
  
 +=== Cursos, dados e scripts sobre Regressão Linear ===
   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts;   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts;
   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt;   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt;
Linha 99: Linha 121:
   * {{http://​www.stat.ufl.edu/​~winner/​Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$;   * {{http://​www.stat.ufl.edu/​~winner/​Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$;
  
 +=== Cartões de referência ===
   * {{http://​www2.kenyon.edu/​Depts/​Math/​hartlaub/​Math305%20Fall2011/​R.htm|Resumo de comandos R e pacotes para regressão}};​   * {{http://​www2.kenyon.edu/​Depts/​Math/​hartlaub/​Math305%20Fall2011/​R.htm|Resumo de comandos R e pacotes para regressão}};​
   * {{http://​cran.r-project.org/​doc/​contrib/​Ricci-refcard-regression.pdf|Cartão de referência para regressão}};​   * {{http://​cran.r-project.org/​doc/​contrib/​Ricci-refcard-regression.pdf|Cartão de referência para regressão}};​
  
 +=== Medidas de diagnóstico ===
   * {{http://​www.stats.ox.ac.uk/​~burke/​Linear%20Models/​Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}};   * {{http://​www.stats.ox.ac.uk/​~burke/​Linear%20Models/​Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}};
   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Slides de medidas de diagnóstico}};​   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Slides de medidas de diagnóstico}};​
Linha 107: Linha 131:
   * {{http://​courses.washington.edu/​b515/​l7.pdf|Exemplos de diagnóstico}};​   * {{http://​courses.washington.edu/​b515/​l7.pdf|Exemplos de diagnóstico}};​
   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}}   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}}
 +
 +=== Regressão com variáveis categóricas ===
 +  * {{http://​www.sagepub.com/​upm-data/​21120_Chapter_7.pdf|Dummy-Variable Regression}};​
 +  * {{http://​gauss.stat.su.se/​gu/​e/​slides/​F6-Dummy-Variable.pdf|Dummy variable regression models}};
 +  * {{http://​socserv.socsci.mcmaster.ca/​jfox/​Courses/​SPIDA/​dummy-regression-notes.pdf|Dummy-Variable Regression}};​
 +  * {{https://​www.princeton.edu/​~slynch/​soc504/​expanding_ols.pdf|Expanding the Model Capabilities:​ Dummy Variables, Interactions,​ and Nonlinear Transformations}}.
  
 ==== Avaliações ==== ==== Avaliações ====
Linha 149: Linha 179:
  
   * Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes.   * Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes.
-  * Verificar que E(\hat\beta) = \beta, var(\hat\beta) = \sigma^2(X'​X)^{-1},​ e que \hat\betas têm distribuição Normal. +  * Verificar que <​latex>​E(\hat\beta) = \beta</​latex>​<​latex>​var(\hat\beta) = \sigma^2(X'​X)^{-1}</​latex>​, e que <​latex>​\hat\betas</​latex> ​têm distribuição Normal. 
-  * Verificar que E(\hat\sigma^2) = \sigma^2 e que (n-p)*\hat\sigma/​\sigma têm distribuição qui-quadrado. +  * Verificar que <​latex>​E(\hat\sigma^2) = \sigma^2</​latex> ​e que <​latex>​(n-p)*\hat\sigma/​\sigma<​\latex> ​têm distribuição qui-quadrado. 
-  * Verificar que F = (A\hat\beta-m)'​[A(X'​X)^{-1}A'​]^{-1}(A\hat\beta-m)/​(r QMRes) têm distribuição F sob H0 que A\betas = m.+  * Verificar que <​latex>​F = (A\hat\beta-m)'​[A(X'​X)^{-1}A'​]^{-1}(A\hat\beta-m)/​(r QMRes)</​latex> ​têm distribuição F sob H0 que <​latex>​A\betas = m</​latex>​.
   * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior.   * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior.
   * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14.   * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14.
Linha 173: Linha 203:
     * DFfits, DFbetas;     * DFfits, DFbetas;
   * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas;   * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas;
 +
 +  * Alavancagem
 +<​latex>​
 +h_i = H_{ii}\\
 +h = \text{diag}(H) = \text{diag}(X(X^\top X)^{-1}X^\top)\\
 +</​latex>​
  
   * Resíduos crus   * Resíduos crus
 <​latex>​ <​latex>​
-oi+e_i = y_i - \hat{y}_i\\ 
 +e = y - \hat{y}\\ 
 +e = y - X\hat{\beta}
 </​latex>​ </​latex>​
  
 +  * Resíduos padronizados (ou internamente studentizados)
 +<​latex>​
 +r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}\sqrt{1-h_{i}}}
 +</​latex>​
  
-</code>+  * Resíduos studentizados (ou externamente studentizados) 
 +<​latex>​ 
 +t_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}_{-i}\sqrt{1-h_{i}}}\\ 
 +\hat{\sigma}_{-i}^2 = \dfrac{(n-p)\hat{\sigma}^2-\frac{e_i^2}{1-h_{i}}}{(n-1)-p} 
 +</​latex>​ 
 + 
 +  * Distância de Cook 
 +<​latex>​ 
 +D_i = \dfrac{(\hat{y}-\hat{y}_{i(-i)})^\top (\hat{y}-\hat{y}_{i(-i)})}{p\hat{\sigma}^2} =  
 +\dfrac{1}{p}\cdot\dfrac{h_i}{(1-h_i)}\cdot\dfrac{e_i^2}{\hat{\sigma}^2(1-h_i)} 
 +</​latex>​ 
 + 
 +  * DFfits 
 +<​latex>​ 
 +dffits_i = \dfrac{\hat{y}_i-\hat{y}_{i(-i))}}{\hat{\sigma}_{-i}\sqrt{h_i}} = t_i\left( \dfrac{h_i}{1-h_i} \right )^{1/2} 
 +</​latex>​ 
 + 
 +  * DFbetas 
 +<​latex>​ 
 +dbetas_i = \dfrac{\hat{\beta}-\hat{\beta}_{-i}}{\hat{\sigma}_{-i}\sqrt{\text{diag}((X^\top X)^{-1})}}\\ 
 +\hat{\beta}_{-i} = \hat{\beta}-\dfrac{e_i}{1-h_i}\cdot (X^\top X)^{-1} x_i 
 +</latex>
  
 <code R> <code R>
 ##​----------------------------------------------------------------------------- ##​-----------------------------------------------------------------------------
 +## Definições da sessão.
  
-require(car)+require(lattice) 
 +require(latticeExtra)
  
 ##​----------------------------------------------------------------------------- ##​-----------------------------------------------------------------------------
-## Dados sobre o preço de leitão (price) de relógios antigos (do avô) em +## Lendo dados sobre os joagadores ​da liga européia ​de futebol.
-## função ​da idade do relógio (age) e do número ​de potenciais +
-## compradores (bidders).+
  
 da <- da <-
-    read.table("​http://​www.leg.ufpr.br/​~walmes/​data/​business_economics_dataset/​EXAMPLES/​GFCLOCKA.DAT", +    read.table("​http://​www.leg.ufpr.br/​~walmes/​data/​euro_football_players.txt", 
-               ​header=FALSE) +               ​header=TRUE, sep="​\t",​ quote="",​ encoding="​utf-8"​)
 str(da) str(da)
  
-## Essa coluna removida é o produto de age*bidders +da <- subset(da, select=c("​pos","​kg","​cm"​))
-da <- da[,-4]+
  
-names(da<- c("age", ​"​bidders"​, "price")+da$gk <- ifelse(da$pos=="GK", ​1-1) 
 +da$gk[grep("^M\\(?​.?​\\)?​$", da$pos)] <- 0 
 + 
 +da <- subset(da, gk>=0)
 str(da) str(da)
 +
 +names(da)[2:​3] <- c("​peso","​altura"​)
 +table(da$gk)
 +
 +xyplot(peso~altura|gk,​ data=da)
  
 ##​----------------------------------------------------------------------------- ##​-----------------------------------------------------------------------------
-## Dados sobre o salário ​em função ​dos anos de experiência de uma +## Preço dos carros ​em função ​da categoria (simples, sedan ou cross).
-## amostra de trabalhadores sociais.+
  
 db <- db <-
-    read.table("​http://​www.leg.ufpr.br/​~walmes/​data/​business_economics_dataset/​EXAMPLES/​SOCWORK.DAT", +    read.table("​http://​www.leg.ufpr.br/​~walmes/​data/​hb20_venda_webmotors_280314.txt", 
-               ​header=FALSE)+               ​header=TRUE, sep="​\t"​) 
 +str(db) 
 + 
 +db <- subset(db, select=c("​carro","​km","​preco"​)) 
 +db <- transform(db,​ km=km/1000, preco=preco/​1000)
  
-names(db) <- c("​yrsexp",​ "​salary"​)+xyplot(preco~km|carro,​ data=db)
  
 ##​----------------------------------------------------------------------------- ##​-----------------------------------------------------------------------------

QR Code
QR Code disciplinas:ce071-2014-01 (generated for current page)