All work and no play makes Jack a dull boy

terça-feira, 25 de agosto de 2015

juntar arquivos CSV usando pandas



pandas ou Python Data Analysis Library é um biblioteca open-source que provê ferramentas de alta performance para estrutura e análise de dados para python.

É uma biblioteca bem poderosa e aqui um exemplo bem simples de como usá-la.

Considere:

primeiro.csv
coluna1,coluna2
1,a
2,b
3,c

segundo.csv
coluna3,coluna4
z,m
x,n
c,h

Para mesclar esses dois csv:

import pandas as pd
primeiro = pd.read_csv('primeiro.csv')
segundo = pd.read_csv('segundo.csv')
mesclado = pd.concat([primeiro, segundo], axis=1)

A saída será algo como:

coluna1coluna2coluna3coluna4
01azm
12bxn
23cch

A documentação cobre, obviamente, muito mais - corre lá.


Nenhum comentário:

Postar um comentário