Pode-se entrar com dados no R de diferentes formas. O formato mais adequado vai depender do tamanho do conjunto de dados, e se os dados já existem em outro formato para serem importados ou se serão digitados diretamente no R.
A seguir são descritas 4 formas de entrada de dados com indicação de quando cada uma das formas deve ser usada. Os três primeiros casos são adequados para entrada de dados diretamente no R, enquanto o último descreve como importar dados já disponíveis eletronicamente.
a1 <- c(2,5,8) # cria vetor a1 com os dados 2, 5 e 8 a1 # exibe os elementos de a1 a2 <- c(23,56,34,23,12,56) a2Esta forma de entrada de dados é conveniente quando se tem um pequeno número de dados.
Quando os dados tem algum ``padrão'' tal como elementos repetidos, números sequenciais pode-se usar mecanismos do R para facilitar a entrada dos dados como vetores. Examine os seguintes exemplos.
a3 <- 1:10 # cria vetor com números sequenciais de 1 a 10 a3 a4 <- (1:10)*10 # cria vetor com elementos 10, 20, ..., 100 a4 a5 <- rep(3, 5) # cria vetor com elemento 3 repetido 5 vezes a5 a6 <- rep(c(5,8), 3) # cria vetor repetindo 3 vezes 5 e 8 alternadamente a6 a7 <- rep(c(5,8), each=3) # cria vetor repetindo 3 vezes 5 e depois 8 a7
y <- scan() #1: 11 #2: 24 #3: 35 #4: 29 #5: 39 #6: 47 #7: #Read 6 items y #[1] 11 24 35 29 39 47
Este formato é maais ágil que o anterior e é conveniente para digitar vetores longos.
edit(data.frame())
abre uma planilha para digitação de dados que são armazanados como data-frames.
Data-frames são o análogo no R a uma planilha.
Portanto digitando
a8 <- edit(data.frame())será aberta uma planilha na qual os dados devem ser digitados. Quando terminar de entrar com os dados note que no canto superior direito da planilha existe um botão <QUIT>. Pressionando este botão a planilha será fechada e os dados serão gravados no objeto indicado (no exemplo acima no objeto a8).
Se voce precisar abrir novamente planilha com os dados, para fazer correções e/ou inserir mais dados
use o comando fix
. No exemplo acima voce digitaria fix(a8)
.
Esta forma de entrada de dados é adequada quando voce tem dados que não podem ser armazenados em um único vetor, por exemplo quando há dados de mais de uma variável para serem digitados.
A forma mais fácil de fazer isto é usar dados em formato texto (arquivo do tipo ASCII). Por exemplo, se seus dados estão disponíveis em uma planilha eletrônica como EXCEL ou similar, voce pode na planilha escolher a opção <SALVAR COMO> e gravar os dados em um arquivo em formato texto.
No R usa-se a função read.table
para ler os dados de um arquivo texto e armazenar
no formato de data-frame.
ex01 <- read.table(``gam01.txt'') ex01
Note que este arquivo difere do anterior em um aspecto: os nomes das variáveis estão na primeira linha.
Para que o R considere isto corretamente temos que informá-lo disto com o argumento head=T
.
Portanto para importar este arquivo usamos:
ex02 <- read.table(``exemplo02.txt'', head=T) ex02
Note que este arquivo difere do primeiro em outros aspectos: além dos nomes das variáveis estarem na primeira linha,
os campos agora não são mais separados por tabulação e sim por :
. Alm disto os caracteres decimais estão separados por vírgula, sendo que o R usa ponto pois é um programa escrito em língua inglesa.
Portanto para importar corretamente este arquivo usamos então os argumentos sep
e dec
:
ex03 <- read.table(``dadosfic.csv'', head=T, sep='':'', dec='','') ex03
Pra maiores informações consulte a documentação desta função com
?read.table
.
É possível ler dados diretamente de outros formatos que não seja texto (ASCII). Para mais detalhes consulte o manual R data import/export.
Para carregar conjuntos de dados que são já disponibilizados com o R use o comando data()