PRÁTICA: VISUALIZAÇÃO NO R

Prática: Visualização da Tabela

Agora vamos visualizar a tabela de dados “funcionario” no R. O padrão utilizado nesta parte do texto é: comando em R + saída.

A função que lê arquivos csv é o read.csv(), que pertence a uma biblioteca nativa do R. Como o arquivo que iremos trabalhar está disponível na web, basta informar o link para a função e teremos nossa tabela de dados. Vamos guardar essa leitura numa estrutura do R tipo data.frame que chamaremos de funcionario. Veja na linha de código abaixo:

funcionario=read.csv("https://docs.google.com/uc?export=download&id=1Pa9jXYztJv42LsUYrJyfUCx8REp0xMfW", sep = ";", dec = ".")

São argumentos dessa função o sep onde informamos o separador de colunas, que no caso desta tabela é ponto e vírgula (;) e o dec onde informamos o separador de decimal que neste caso desta tabela é o ponto (.).

Esta mesma função pode ser utilizada para a leitura de arquivos locais, neste caso basta informar o caminho e nome do arquivo local.

funcionario = read.csv("caminho/funcionario.csv", sep = ";", dec = ".")

Agora que a tabela já se encontra no R, vamos ver algumas funções úteis (todas de bibliotecas nativas do R) que nos ajudarão a visualizar nossos dados:

  • View() retorna a tabela de dados completa para visualizarmos se os dados foram carregados corretamente:

View(funcionario)

  • head() retorna as n primeiras linhas de todas as colunas da tabela.

head(funcionario, n=5)

  • tail() retorna as n últimas linhas de todas as colunas da tabela.

tail(funcionario, n=5)

As funções head() e tail() podem ser utilizadas para verificar se houve deslocamento dos dados, conforme exposto anteriormente. Também podem ser utilizadas de forma combinada para avaliar o que ocorre na parte central da tabela.

  • Combinando head() e tail() : Nesse exemplo buscamos as 5 últimas observações das 20 primeiras, isto é, as observações 15 a 20 da tabela.

tail(head(funcionario, n=20), n=5)

  • str() retorna algumas informações importantes da tabela de dados. O número de linhas e colunas, o nome das colunas, o tipo de dado e as primeiras observações de cada coluna. No caso de não possuir um dicionário de dados, algumas dessas informações podem ajudar, mas não resolvem a falta de descrição.

str(funcionario)

  • dim() retorna as dimensões da tabela de dados (número de linhas e colunas).

dim(funcionario)

  • names() retorna o nome das colunas.

names(funcionario)

Guest User