PRÁTICA: MANIPULAÇÃO DE DADOS NO PYTHON

Prática: Manipulação

Tendo os dados em um data frame no Python, podemos acessar individualmente colunas e linhas, ou ainda elementos específicos.

Para acessar linhas, colunas ou elementos de um data frame utiliza-se a função .loc[n][m], informando-se os índices linha, n, e coluna, m, ou o nome da coluna. Para acessar colunas também se pode utilizar .loc[:][m]. Para acessar linhas use .loc[n].

Dica! No Python a primeira linha e a primeira coluna tem índice igual a zero, isto é, se você quiser buscar o primeiro elemento, deverá ler o índice 0.

  • Acessando uma coluna: id_funcionario. Podemos utilizar a função .loc nas duas formas apresentadas abaixo.

funcionario.loc[:, ['id_funcionario']]
funcionario.loc[0:, ['id_funcionario']]
  • Acessando uma linha: linha 2 da tabela (lembra da dica: índice começa em zero!).

funcionario.loc[1]
  • Acessando um elemento: instrucao da linha 2 da tabela. (lembra da dica: índice começa em zero e [5] é a coluna equivalente a variável instrução.

funcionario.loc[1][5]

ou

funcionario.loc[1]['instrucao']

  • Acessando um intervalo de dados: os 5 primeiros funcionários.

funcionario.loc[0:4]
  • Acessando um intervalo de dados: O salario dos 5 primeiros funcionários.

funcionario.loc[0:4]['salario']

Podemos ainda querer ordenar a tabela de dados de acordo com uma coluna. Para isto, utilizaremos a função sort_values ('nome da variável', ascending=True). No exemplo abaixo, a tabela está sendo ordenada crescente pela coluna nome (a figura mostra apenas o início da tabela).

funcionario.sort_values('nome', ascending=True)

A mesma função pode ser utilizada para a ordenação decrescente, utilizando o argumento ascending= False.

funcionario.sort_values('nome', ascending=False)

Podemos ainda ter a necessidade de utilizar várias colunas na ordenação. O exemplo abaixo ordena a tabela de forma decrescente, primeiro por nfilhos e depois por salario.

funcionario.sort_values(['nfilhos','salario'], ascending=False)

Ou ainda podemos ordenar por uma coluna na ordem crescente e por outra na ordem decrescente. O exemplo abaixo ordena a tabela de forma decrescente por nfilhos e de forma crescente por salario . No argumeto ascending devemos colocar se a ordenação decrescente deve ser utilizada ou não.

funcionario.sort_values(['nfilhos','salario'], ascending=(True, False))
Guest User