Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior Próxima revisão Ambos lados da revisão seguinte | ||
disciplinas:ce071-2014-01 [2014/03/19 09:46] walmes |
disciplinas:ce071-2014-01 [2014/04/09 18:27] walmes |
||
---|---|---|---|
Linha 3: | Linha 3: | ||
{{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} | {{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} | ||
- | ===== Detalhes da oferta da disciplina ===== | + | ==== Detalhes da oferta da disciplina ==== |
* Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]]) | * Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]]) | ||
Linha 12: | Linha 12: | ||
* Atendimento: Segunda, 19:00-20:30h. | * Atendimento: Segunda, 19:00-20:30h. | ||
- | ===== Scripts, notas e documentos ====== | + | ==== Scripts, notas e documentos ==== |
<note tip> | <note tip> | ||
Linha 20: | Linha 20: | ||
{{url>http://www.leg.ufpr.br/~walmes/ensino/ce071-2014-01/ 800px, 600px center}} | {{url>http://www.leg.ufpr.br/~walmes/ensino/ce071-2014-01/ 800px, 600px center}} | ||
- | ===== Histórico das Aulas do Curso ====== | + | ==== Histórico das Aulas do Curso ==== |
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. | Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. | ||
Linha 53: | Linha 53: | ||
* Intervalos de confiança para \beta_j e funções lineares de \beta; | * Intervalos de confiança para \beta_j e funções lineares de \beta; | ||
* Intervalos de confiança para o valor predito e para observação futura. | * Intervalos de confiança para o valor predito e para observação futura. | ||
- | - 19/03 | + | - 19/03: |
- | - 24/03 | + | * Prática de regressão linear múltipla com o R; |
- | - 26/03 | + | * Estudo sobre o preço de imóveis em função da área. |
+ | - 24/03: | ||
+ | * Fórmulas e matrizes correspondentes ao declarar modelos; | ||
+ | * Tipos de parametrizações em modelos lineares para variáveis categóricas; | ||
+ | * Prática de regressão linear múltipla com o R. | ||
+ | - 26/03: | ||
+ | * Prática de regressão linear múltipla com o R; | ||
+ | * Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio; | ||
+ | * Especificação e testes de hipóteses entre modelos aninhados. | ||
- 31/03 | - 31/03 | ||
- 02/04 | - 02/04 | ||
Linha 83: | Linha 91: | ||
- 25/06 | - 25/06 | ||
- | ===== Avaliações ====== | + | ==== Links úteis ==== |
+ | |||
+ | * {{http://www.ats.ucla.edu/stat/sas/examples/chp/|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts; | ||
+ | * {{http://www.ats.ucla.edu/stat/sas/examples/chp/chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt; | ||
+ | * {{http://www.ats.ucla.edu/stat/stata/examples/ara/default.htm|Applied Regression Analysis, by Fox}} | ||
+ | * {{http://www.ats.ucla.edu/stat/stata/examples/alsm/default.htm|Applied Lin Stat Models, by Neter, Kutner, Nachtsheim, and Wasserman}} | ||
+ | * {{http://www.stat.ufl.edu/~winner/Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$; | ||
+ | |||
+ | * {{http://www2.kenyon.edu/Depts/Math/hartlaub/Math305%20Fall2011/R.htm|Resumo de comandos R e pacotes para regressão}}; | ||
+ | * {{http://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf|Cartão de referência para regressão}}; | ||
+ | |||
+ | * {{http://www.stats.ox.ac.uk/~burke/Linear%20Models/Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}}; | ||
+ | * {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Slides de medidas de diagnóstico}}; | ||
+ | * {{http://www.stat.purdue.edu/~jennings/stat514/stat512notes/topic5.pdf|Resumo de medidas de diagnóstico}}; | ||
+ | * {{http://courses.washington.edu/b515/l7.pdf|Exemplos de diagnóstico}}; | ||
+ | * {{http://statweb.stanford.edu/~jtaylo/courses/stats203/notes/diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}} | ||
+ | |||
+ | ==== Avaliações ==== | ||
=== Trabalho 1 === | === Trabalho 1 === | ||
- | Programar em R: | + | * Função para estimação de beta a partir de X e y. Implementar o método de estimação literal, decomposição de Cholesky e decomposição QR. |
- | - Função para estimação de \beta a partir de X e y. Implementar o método de estimação literal, decomposição de Cholesky e decomposição QR. <WRAP center round box 60%> | + | * Função para calcular o quadro de análise de variância. |
+ | * Função para tabela de estimativas com erro-padrão e IC. | ||
+ | * Função para quadro de anova particionado. | ||
+ | * Função para calcular o valor predito com IC. | ||
+ | * Entregar o código impresso das funções programadas no dia 24/03/14. | ||
<code R> | <code R> | ||
- | estima <- function(X, y, method){ | + | ## Estima o vetor de parâmetros \beta |
+ | mycoef <- function(X, y, method){ | ||
+ | ... | ||
+ | } | ||
+ | |||
+ | ## Retorna o quadro de análise de variância corrigido para a média | ||
+ | myanova <- function(X, y){ | ||
+ | ... | ||
+ | } | ||
+ | |||
+ | ## Retorna a tabela com erros padrões, t-valor, p-valor e IC para \betas | ||
+ | mycoeftable <- function(X, y, conf=0.95){ | ||
+ | ... | ||
+ | } | ||
+ | |||
+ | ## Retorna o quadro de análise de variância particionado para X1 | ||
+ | myanovapart <- function(X, y, X1){ | ||
+ | ... | ||
+ | } | ||
+ | |||
+ | ## Retorna o valor predito com IC | ||
+ | mypredict <- function(x0, betas, vcov, conf){ | ||
... | ... | ||
- | return(betas) | ||
} | } | ||
</code> | </code> | ||
- | </WRAP> | + | === Trabalho 2 === |
+ | |||
+ | * Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes. | ||
+ | * Verificar que <latex>E(\hat\beta) = \beta</latex>, <latex>var(\hat\beta) = \sigma^2(X'X)^{-1}</latex>, e que <latex>\hat\betas</latex> têm distribuição Normal. | ||
+ | * Verificar que <latex>E(\hat\sigma^2) = \sigma^2</latex> e que <latex>(n-p)*\hat\sigma/\sigma<\latex> têm distribuição qui-quadrado. | ||
+ | * Verificar que <latex>F = (A\hat\beta-m)'[A(X'X)^{-1}A']^{-1}(A\hat\beta-m)/(r QMRes)</latex> têm distribuição F sob H0 que <latex>A\betas = m</latex>. | ||
+ | * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior. | ||
+ | * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14. | ||
+ | |||
+ | <code R> | ||
+ | ## Função que retorna estimativas de parâmetros e estatísticas sob uma | ||
+ | ## amostra aleatória simulada ao ser executada. | ||
+ | mysimula <- function(X, beta, sigma, A, m=beta){ | ||
+ | ... | ||
+ | } | ||
+ | |||
+ | results <- replicate(10000, mysimula) | ||
+ | </code> | ||
+ | |||
+ | === Trabalho 3 === | ||
+ | |||
+ | * Programar funções para obter: | ||
+ | * Resíduos ordinários, padronizados e studentizados; | ||
+ | * Valores de alavancagem; | ||
+ | * Distância de Cook; | ||
+ | * DFfits, DFbetas; | ||
+ | * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas; | ||
+ | |||
+ | * Alavancagem | ||
+ | <latex> | ||
+ | h_i = H_{ii}\\ | ||
+ | h = \text{diag}(H) = \text{diag}(X(X^\top X)^{-1}X^\top)\\ | ||
+ | </latex> | ||
+ | |||
+ | * Resíduos crus | ||
+ | <latex> | ||
+ | e_i = y_i - \hat{y}_i\\ | ||
+ | e = y - \hat{y}\\ | ||
+ | e = y - X\hat{\beta} | ||
+ | </latex> | ||
+ | |||
+ | * Resíduos padronizados (ou internamente studentizados) | ||
+ | <latex> | ||
+ | r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}\sqrt{1-h_{i}}} | ||
+ | </latex> | ||
+ | |||
+ | * Resíduos studentizados (ou externamente studentizados) | ||
+ | <latex> | ||
+ | t_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}_{-i}\sqrt{1-h_{i}}}\\ | ||
+ | \hat{\sigma}_{-i}^2 = \dfrac{(n-p)\hat{\sigma}^2-\frac{e_i}{1-h_{i}}}{(n-1)-p} | ||
+ | </latex> | ||
+ | |||
+ | * Distância de Cook | ||
+ | <latex> | ||
+ | D_i = \dfrac{(\hat{y}-\hat{y}_{i(-i)})^\top (\hat{y}-\hat{y}_{i(-i)})}{p\hat{\sigma}^2} = | ||
+ | \dfrac{1}{p}\cdot\dfrac{h_i}{(1-h_i)}\cdot\dfrac{e_i^2}{\hat{\sigma}^2(1-h_i)} | ||
+ | </latex> | ||
+ | |||
+ | * DFfits | ||
+ | <latex> | ||
+ | dffits_i = \dfrac{\hat{y}_i-\hat{y}_{i(-i))}}{\hat{\sigma}_{-i}\sqrt{1-h_i}} = \left( \dfrac{p\cdot D_i \cdot\hat{\sigma}^2}{\hat{\sigma}^2_{-i}} \right )^{1/2} | ||
+ | </latex> | ||
+ | |||
+ | * DFbetas | ||
+ | <latex> | ||
+ | dbetas_i = \dfrac{\hat{\beta}-\hat{\beta}_{-i}}{\hat{\sigma}_{-i}\sqrt{\text{diag}((X^\top X)^{-1})}}\\ | ||
+ | \hat{\beta}_{-i} = \hat{\beta}-\dfrac{e_i}{1-h_i}\cdot (X^\top X)^{-1} x_i | ||
+ | </latex> | ||
+ | |||
+ | <code R> | ||
+ | ##----------------------------------------------------------------------------- | ||
+ | ## Definições da sessão. | ||
+ | |||
+ | require(lattice) | ||
+ | require(latticeExtra) | ||
+ | require(car) | ||
+ | |||
+ | ## RSiteSearch("VIF regression") | ||
+ | ## require(faraway) ## tem a função vif() | ||
+ | ## require(fmsb) ## tem a função VIF() | ||
+ | |||
+ | ## Função vif da página da Professora Dra Sueli Giolo. | ||
+ | source("http://people.ufpr.br/~giolo/CE071/Exemplos/vif.R") | ||
+ | |||
+ | ## Several packages in R provide functions to calculate VIF: vif in | ||
+ | ## package HH, vif in package car, VIF in package fmsb, vif in package | ||
+ | ## faraway, and vif in package VIF. The number of packages that provide | ||
+ | ## VIF functions is surprising given that they all seem to accomplish | ||
+ | ## the same thing. | ||
+ | ## | ||
+ | ## http://beckmw.wordpress.com/2013/02/05/collinearity-and-stepwise-vif-selection | ||
+ | |||
+ | ## http://courses.ttu.edu/isqs5349-westfall/images/5349/multicollinearity_99.htm | ||
+ | ## Considere o conjunto de dados turtles.txt em | ||
+ | ## http://westfall.ba.ttu.edu/isqs5349/Rdata/turtles.txtx | ||
+ | |||
+ | ##----------------------------------------------------------------------------- | ||
+ | |||
+ | prelink <- "http://www.leg.ufpr.br/~walmes/data/business_economics_dataset" | ||
+ | |||
+ | da <- read.table(paste(prelink, "/EXAMPLES/FTC.DAT", sep=""), | ||
+ | header=FALSE) | ||
+ | str(da) | ||
+ | |||
+ | names(da) <- c("tar", "nicotine", "weight", "co") | ||
+ | str(da) | ||
+ | |||
+ | ## tar: conteúdo de alcatrão; | ||
+ | ## nicotine: conteúdo de nicotina; | ||
+ | ## weight: peso; | ||
+ | ## co: monoxido de carbono; | ||
+ | |||
+ | ## Os valores no data.frame são dos valores de alcatrão, nicotina e | ||
+ | ## monoxido de carbono (mg) e peso (g) para uma amostra de 25 marcas de | ||
+ | ## filtros testados. Deseja-se modelar o monoxido de carbono como função | ||
+ | ## das demais variáveis. | ||
+ | |||
+ | m0 <- lm(co~tar+nicotine+weight, data=da) | ||
+ | summary(m0) | ||
+ | |||
+ | par(mfrow=c(2,2)) | ||
+ | plot(m0) | ||
+ | layout(1) | ||
+ | |||
+ | ##----------------------------------------------------------------------------- | ||
+ | </code> | ||
+ | |||
+ | |||
+ | ==== Links de arquivos e dados disponibilizados pelos alunos ==== | ||
+ | |||
+ | {{threads>pessoais:walmes:ce071-2014-01:discussion}} | ||
+ | |||
+ | ~~DISCUSSION~~ | ||
+ | |||
+ | /* | ||
+ | === Passos para disponibilizar arquivos no DATAFILEHOST === | ||
+ | |||
+ | - Subir os arquivos (preferencialmente *.txt para dados) site {{http://www.datafilehost.com/|datafilehost}}; | ||
+ | - Seguir as etapas caixas numeradas da figura abaixo: 1 - escolher o arquivo, 2 - fazer upload, 3 - copiar o link para colar na mensagem e 4 - em caso de erro use o link para deletar o arquivo; | ||
+ | - Junto ao link para o arquivo coloque informações sobre o mesmo livro do qual foi retirado, página, número da tabela, nomenclatura das variáveis, contexto, objetivos da análise, unidade de medida das variáveis. As caixas numeradas indicam: 1 - identificação do remetente, 2 - mensagem contendo informações básicas e link para download, 3 - preenchimento de código de segurança e 4 - para concluir com o envio da mensagem. | ||
+ | |||
+ | {{http://www.leg.ufpr.br/~walmes/ensino/passos_datafilehost.png?800|}} | ||
- | - Função para calcular | + | {{http://www.leg.ufpr.br/~walmes/ensino/passos_discussao.png?800|}} |
+ | */ |