PRÁTICA: MANIPULAÇÃO DE DADOS NO PYTHON
Prática: Manipulação
Tendo os dados em um data frame no Python, podemos acessar individualmente colunas e linhas, ou ainda elementos específicos.
Para acessar linhas, colunas ou elementos de um data frame utiliza-se a função .loc[n][m], informando-se os índices linha, n, e coluna, m, ou o nome da coluna. Para acessar colunas também se pode utilizar .loc[:][m]. Para acessar linhas use .loc[n].
Dica! No Python a primeira linha e a primeira coluna tem índice igual a zero, isto é, se você quiser buscar o primeiro elemento, deverá ler o índice 0.
Acessando uma coluna: id_funcionario. Podemos utilizar a função .loc nas duas formas apresentadas abaixo.
Acessando uma linha: linha 2 da tabela (lembra da dica: índice começa em zero!).
Acessando um elemento: instrucao da linha 2 da tabela. (lembra da dica: índice começa em zero e [5] é a coluna equivalente a variável instrução.
ou
funcionario.loc[1]['instrucao']
Acessando um intervalo de dados: os 5 primeiros funcionários.
Acessando um intervalo de dados: O salario dos 5 primeiros funcionários.
Podemos ainda querer ordenar a tabela de dados de acordo com uma coluna. Para isto, utilizaremos a função sort_values ('nome da variável', ascending=True). No exemplo abaixo, a tabela está sendo ordenada crescente pela coluna nome (a figura mostra apenas o início da tabela).
funcionario.sort_values('nome', ascending=True)
A mesma função pode ser utilizada para a ordenação decrescente, utilizando o argumento ascending= False.
Podemos ainda ter a necessidade de utilizar várias colunas na ordenação. O exemplo abaixo ordena a tabela de forma decrescente, primeiro por nfilhos e depois por salario.
Ou ainda podemos ordenar por uma coluna na ordem crescente e por outra na ordem decrescente. O exemplo abaixo ordena a tabela de forma decrescente por nfilhos e de forma crescente por salario . No argumeto ascending devemos colocar se a ordenação decrescente deve ser utilizada ou não.