All work and no play makes Jack a dull boy

quarta-feira, 16 de setembro de 2015

extraindo colunas de csv e excel usando pandas

(ou criando subsets de dados usando pandas)



Já mostrei como é fácil ler e exportar dados de arquivo csv ou xls usando pandas, mas digamos que diante de um dataset com várias colunas, você precise isolar algumas.

Dado o seguinte:
In [1]:
import pandas as pd
In [3]:
dados = pd.read_csv('file.csv')
In [4]:
dados
Out[4]:
abcd
01234
15678

Caso você queira um range de colunas você pode:
In [5]:
dados.ix[:,1:3]
Out[5]:
bc
023
167


Caso queira separar pelo header:
In [6]:
dados[['b','d']]
Out[6]:
bd
024
168


Após isso, em ambos, caso queira os dados de uma coluna, basta usar:
In [7]:
novo = dados[['b', 'd']]
In [8]:
novo['b']
Out[8]:
0    2
1    6

=]

ps: usei o https://try.jupyter.org/ para construir esses exemplos e, lá, sempre são impressos à esquerda o número das colunas.

Nenhum comentário:

Postar um comentário