PRÁTICA: FILTRANDO DADOS NO R
Prática: Filtro
Para selecionar uma ou mais linhas da tabela de dados, é necessário a definição de critérios para os filtros. Uma vez definido o filtro, ele é aplicado a todas as linhas da tabela de dados. O produto resultante de uma filtragem são linhas que satisfazem as definições dos critérios.
Para os critérios utiliza-se os seguintes operadores:
Para filtrar valores de variáveis numéricas se utiliza diretamente um número. Para filtrar valores de variáveis textuais, utiliza-se o valor dentro de aspas que podem ser duplas ou simples. É importante ressaltar que valores textuais são procurados exatamente como são escritos, ou seja, “Mariana” é diferente de “mariana”.
Acessando apenas a linha em que id_funcionario é igual a 2005.
Acessando apenas as linhas em que instrucao é diferente de superior.
Acessando apenas as linhas em que salario é maior que 10.
Acessando apenas as linhas em que salario é menor ou igual que 5 e plano_de_saude é VERDADEIRO.
Acessando apenas as linhas em que instrucao é fundamental ou salario é menor que 5.
Agora que já tivemos o primeiro contato com a nossa tabela de dados, podemos passar para o próximo assunto onde vamos explorar a qualidade dos dados e ver como realizar as limpezas necessárias em nossa tabela.
Observação: Todos os arquivos de dados e scripts utilizados neste material estão disponíveis na pasta deste link.