Operações SQL no Pandas

Pandas SQL操作的具体实例

由于许多潜在的Pandas用户都对SQL有所了解，因此本页面旨在提供一些示例说明如何使用Pandas执行各种SQL操作。

Exemplo

　import　pandas　como　pd
　url　=　'https://raw.github.com/pandasdev/
　pandas/mestre/pandas/testes/dados/dicas.csv'
　dicas=pd.read_csv(url)
　print　tips.head()

O resultado da execução é o seguinte:

　　　　　　total_bill　　　tip　　　　　　sex　　smoker　　day　　　　　time　　size
0　　　　　　　　16.99　　1.01　　　Female　　　　　　No　　Sun　　Dinner　　　　　　2
1　　　　　　　　10.34　　1.66　　　　　Male　　　　　　No　　Sun　　Dinner　　　　　　3
2　　　　　　　　21.01　　3.50　　　　　Male　　　　　　No　　Sun　　Dinner　　　　　　3
3　　　　　　　　23.68　　3.31　　　　　Male　　　　　　No　　Sun　　Dinner　　　　　　2
4　　　　　　　　24.59　　3.61　　　Female　　　　　　No　　Sun　　Dinner　　　　　　4

查询

在SQL中，选择是使用您选择的列的逗号分隔列表（或使用*来选择所有列）来完成的：

　SELECT　total_bill,　tip,　smoker,　time
　do　dicas
　LIMIT　5;

使用Pandas，通过将列名称列表传递到DataFrame来完成列选择：

　tips[['total_bill',　'tip',　'smoker',　'time']].head(5)

让我们看一个完整的实例：

Exemplo

　import　pandas　como　pd
　url　=　'https://raw.github.com/pandasdev/
　pandas/mestre/pandas/testes/dados/dicas.csv'
　　
　dicas=pd.read_csv(url)
　print　tips[['total_bill',　'tip',　'smoker',　'time']].head(5)

O resultado da execução é o seguinte:

　　　total_bill　　　tip　　smoker　　　　　time
0　　　　　　　16.99　　1.01　　　　　　No　　　Dinner
1　　　　　　　10.34　　1.66　　　　　　No　　　Dinner
2　　　　　　　21.01　　3.50　　　　　　No　　　Dinner
3　　　　　　　23.68　　3.31　　　　　　No　　　Dinner
4　　　　　　　24.59　　3.61　　　　　　No　　　Dinner

调用不带列名列表的DataFrame将显示所有列（类似于SQL的*）。

WHERE条件查询

通过WHERE子句在SQL中进行过滤。

　SELECT　*　from　tips　WHERE　time　=　'Dinner'　LIMIT　5;

DataFrame可以通过多种方式进行过滤。最直观的方法是使用布尔索引。

　tips[tips['time']　==　'Dinner'].head(5)

Vamos ver um exemplo completo

Exemplo

　import　pandas　como　pd
　url　=　'https://raw.github.com/pandasdev/
　pandas/mestre/pandas/testes/dados/dicas.csv'
　dicas=pd.read_csv(url)
　print　tips[tips['time']　==　'Dinner'].head(5)

O resultado da execução é o seguinte:

　　　　　total_bill　　　tip　　　　　　sex　　smoker　　day　　　　time　　size
0　　　　　　　16.99　　1.01　　　Female　　　　　No　　　Sun　　Dinner　　　　2
1　　　　　　　10.34　　1.66　　　　　Male　　　　　No　　　Sun　　Dinner　　　　3
2　　　　　　　21.01　　3.50　　　　　Male　　　　　No　　　Sun　　Dinner　　　　3
3　　　　　　　23.68　　3.31　　　　　Male　　　　　No　　　Sun　　Dinner　　　　2
4　　　　　　　24.59　　3.61　　　Female　　　　　No　　　Sun　　Dinner　　　　4

A sentença acima transmitirá uma série de True / Passar um objeto False para DataFrame e retornar todas as linhas com True.

GroupBy分组

Esta operação obtém o número de registros em cada grupo do conjunto de dados completo. Por exemplo, consulte a分组 e a quantidade:

　SELECT　sexo,　count(*)
　do　dicas
　GROUP　BY　sexo;

As operações no Pandas são as seguintes:

　dicas.groupby('sexo').size()

Vamos ver um exemplo completo

Exemplo

　import　pandas　como　pd
　url　=　'https://raw.github.com/pandasdev/
　pandas/mestre/pandas/testes/dados/dicas.csv'
　dicas=pd.read_csv(url)
　print　dicas.groupby('sexo').size()

O resultado da execução é o seguinte:

　sexo
　Feminino　87
　Masculino　157
　dtype:　int64

Quantidade de linhas consultadas

Uso do LIMIT no SQL para retornar N linhas:

　SELECT　*　do　dicas
　LIMIT　5　;

As operações no Pandas são as seguintes:

　dicas.head(5)

Vamos ver um exemplo completo

Exemplo

　import　pandas　como　pd
　url　=　'https://raw.github.com/pandas-dev/pandas/mestre/pandas/testes/dados/dicas.csv'
　dicas=pd.read_csv(url)
　dicas　=　dicas[['fumante',　'dia',　'tempo']].head(5)
　print　dicas

O resultado da execução é o seguinte:

　　　　　dia　　　fumante　　　tempo
0　　　　　　No　　　Sob　　　Jantar
1　　　　　　No　　　Sob　　　Jantar
2　　　　　　No　　　Sob　　　Jantar
3　　　　　　No　　　Sob　　　Jantar
4　　　　　　No　　　Sob　　　Jantar

Atenção no Pandas

Pandas 教程

Operações SQL no Pandas

查询

WHERE条件查询

GroupBy分组

Quantidade de linhas consultadas