PRÁTICA: FILTRANDO DADOS NO R

Prática: Filtro

Para selecionar uma ou mais linhas da tabela de dados, é necessário a definição de critérios para os filtros. Uma vez definido o filtro, ele é aplicado a todas as linhas da tabela de dados. O produto resultante de uma filtragem são linhas que satisfazem as definições dos critérios.

Para os critérios utiliza-se os seguintes operadores:

Para filtrar valores de variáveis numéricas se utiliza diretamente um número. Para filtrar valores de variáveis textuais, utiliza-se o valor dentro de aspas que podem ser duplas ou simples. É importante ressaltar que valores textuais são procurados exatamente como são escritos, ou seja, “Mariana” é diferente de “mariana”.

  • Acessando apenas a linha em que id_funcionario é igual a 2005.

funcionario[funcionario$id_funcionario==2005,]
  • Acessando apenas as linhas em que instrucao é diferente de superior.

funcionario[funcionario$instrucao!="superior", ]
  • Acessando apenas as linhas em que salario é maior que 10.

funcionario[funcionario$salario>10,]
  • Acessando apenas as linhas em que salario é menor ou igual que 5 e plano_de_saude é VERDADEIRO.

funcionario[funcionario$salario<=5 & funcionario$plano_de_saude=="VERDADEIRO", ]
  • Acessando apenas as linhas em que instrucao é fundamental ou salario é menor que 5.

funcionario[funcionario$instrucao=="fundamental" | funcionario$salario<5, ]

Agora que já tivemos o primeiro contato com a nossa tabela de dados, podemos passar para o próximo assunto onde vamos explorar a qualidade dos dados e ver como realizar as limpezas necessárias em nossa tabela.

Observação: Todos os arquivos de dados e scripts utilizados neste material estão disponíveis na pasta deste link.

Guest User