Manipulação e Visualização de Dados

leg.ufpr.br/~walmes/cursoR/data-vis

Resumo

A maior parte do esforço na análise de dados está na manipulação dos dados: leitura, preparo, higienização, imputação, aprimoramento, seleção, agregação, síntese e visualização. O ambiente R para computação estatística e gráficos, como linguagem de programação, dipõe recursos para manipulação de dados desde as primeiras versões. A recente abordagem tidyverse, no entanto, se baseia em uma gramática clara para a manipulação de dados, o que reduz o tempo de confecção e entendimento de instruções de código, tornando-o mais portável e reproduzível. Em vários aspectos, também tem melhor performance computacional. Nesse Curso, é abordado o uso coordenado de pacotes da coleção tidyverse, com ênfase nos seus principais recursos para manipulação e visualização de dados. Exemplos baseados em conjuntos de dados reais e scripts R são disponibilizados.

A visualização permite rápida extração de insights de problemas baseados em dados. É a língua nativa para comunicação de padrões, tendências e fatos dos dados para humanos e entre humanos. Inúmeros softwares e planilhas eletrônicas oferecem recursos para confecção de gráficos. Ainda que haja tal disponibilidade, são vistos com frequência representações de má qualidade no âmbito profissional e acadêmico. Dessa forma, o conhecimento dos princípios de visualização gráfica e o domínio de recursos computacionais para elaboração ágil, interativa e reproduzível são fundamentais para obter visualizações que comuniquem valor de forma descomplicada em todos os aspectos: elaboração, leitura e interpretação. Esse Curso também são discutidos fundamentos da visualização de dados e sua aplicação no ambiente R. A ênfase é tanto instrumentar o uso coordenado de pacotes e funções do R como também desenvolver massa crítica para construção e apreciação de representações gráficas de dados.

Conteúdo

  1. Revisão de princípios de programação em R.
  2. Manipulação de dados com tidyverse.
    1. A organização lógica e filosófica do tidyverse.
    2. Importação, represetação e exportação de dados.
    3. Organização e limpeza de dados.
    4. Manipulação de dados.
    5. Análise descritiva.
    6. Tratatamento de strings e fatores.
  3. Recursos gráficos estáticos e interativos.
    1. Princípios de visualização de dados.
    2. Recusos para visualização estática.
    3. Recursos para visualização dinâmica.
  4. Programação funcional.
  5. Introdução aos relatórios dinâmicos.

Realizações do Curso

V2.2: GemMelhor-UFV

  • Organização: GenMelhor UFV.
  • Público: Alunos de Pós Graduação.
  • Instrutor: Prof. Walmes M. Zeviani.
  • Local: Laboratório de Biometria - Departamento de Biologia Geral.
  • Período: 18 a 21 de Março de 2019 das 10h às 12h e 14h às 17h.
  • Carga horária: 20 horas.

V2.0: DES-UFLA

V1.0: GEN-UFLA

Local Terça 07/08/2018 Quarta 08/08 Quinta 09/08
PV3 sala 06 09h – 12h 09h – 12h
PV3 sala 06 14h – 17h 14h – 17h 14h – 17h

Materiais úteis

  1. Livros online:
    1. R for Data Science.
    2. Advanced R.
    3. Efficient R Programming.
    4. Hands-On Programming with R.
  2. Homepages:
    1. tidyverse.
    2. ggplot2.
    3. lattice.
    4. latticeExtra.
  3. Materiais de cursos:
    1. Introduction to the R tidyverse - Erik Barry Erhardt.
    2. An Introduction to Tidyverse - Joey Stanley.
    3. A Two Hour Tour of the Tidyverse - Aimee Gott.
    4. Dplyr Introduction - Matthew Flickinger.
    5. Getting Started in R: Tidyverse Edition - Saghir Bashir.
    6. Introduction à R et au tidyverse - Julien Barnier.
    7. The tidyverse style guide - Hadley Wickham.
    8. Une introduction à Tidyverse - Christophe Ambroise.
    9. Hadley Wickham - ggplot: Elegant graphics for data analysis.
    10. Data Visualization Using R & ggplot - Karthik Ram.
    11. A ggplot2 Primer.
    12. ggplot2: Introduction and exercises - Umer Zeeshan Ijaz.
    13. Getting started with ggplot2 - Gaston Sanchez.
    14. Concepts in Computing with Data - Gaston Sanchez.
    15. STAT 408.
    16. Charts with ggplot2 -Andrew Ba Tran.
  4. Folhas de referência (cheatsheets):
    1. R Reference Card.
    2. Base R.
    3. Advanced R.
    4. Data import.
    5. Data transformation.
    6. Data visualization.
    7. R Markdown.
    8. Data Wranglingwith dplyr and tidyr.
    9. data.table.

Referências bibliográficas

25px

Licença Creative Commons 4.0

Este conteúdo está disponível por meio da Licença Creative Commons 4.0