English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Visualização do Pandas

    Exemplos de operações de visualização do Pandas

Plotagem básica: Plotagem

A função deste Series e DataFrame é apenas uma simples envoltória ao redor do método plot() da biblioteca matplotlib.

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
    periods=10), columns=list('ABCD'))
 df.plot()

Os resultados da execução são os seguintes:

Se o índice for composto por datas, ele chamará gct().autofmt_xdate() para formatar o eixo x, como mostrado na figura acima.
Podemos usar as chaves x e y para desenhar a relação entre uma coluna e outra.

Além do gráfico de linha padrão, os métodos de plotagem permitem usar vários estilos de plotagem. Esses métodos podem ser fornecidos como parâmetro de chave kind no plot(). Esses incluem:

Gráfico de barras Histograma Gráfico de caixa Gráfico de Área Gráfico de Dispersão Gráfico de Pizza

Gráfico de barras

Vamos ver como criar um gráfico de barras:

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.bar()

Os resultados da execução são os seguintes:

Gera gráficos de barras empilhadas, pode-se configurar stacked=True

import pandas as pd
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.bar(stacked=True)

Os resultados da execução são os seguintes:

Para obter um gráfico de barras horizontal, pode-se usar o método barh:

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.barh(stacked=True)

Os resultados da execução são os seguintes:

Histograma

Pode-se usar o método plot.hist() para desenhar histogramas. Podemos especificar a quantidade.

import pandas as pd
 import numpy as np
 df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.plot.hist(bins=20)

Os resultados da execução são os seguintes:

Pode-se usar o seguinte código para desenhar histogramas diferentes para cada coluna:

import pandas as pd
 import numpy as np
 df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.diff.hist(bins=20)

Os resultados da execução são os seguintes:

Gráfico de caixa

Pode-se desenhar um Boxplot chamando Series.box.plot() e DataFrame.box.plot() ou DataFrame.boxplot() para visualizar a distribuição dos valores em cada coluna.
Por exemplo, este é um gráfico de caixa, representando uma variável aleatória em [0,1por exemplo, este é um gráfico de caixa, representando uma variável aleatória em10cinco testes para cinco observações.

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 5), colunas=['A', 'B', 'C', 'D', 'E'])
 df.plot.box()

Os resultados da execução são os seguintes:

Gráfico de Área

Você pode criar um gráfico de área usando o método Series.plot.area() ou DataFrame.plot.area().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 4), colunas=['a', 'b', 'c', 'd'])
 df.plot.area()

Os resultados da execução são os seguintes:

Gráfico de Dispersão

Para criar um gráfico de dispersão, você pode usar o método DataFrame.plot.scatter().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(50, 4), colunas=['a', 'b', 'c', 'd'])
 df.plot.scatter(x='a', y='b')

Os resultados da execução são os seguintes:

Gráfico de Pizza

Para criar um gráfico de pizza, você pode usar o método DataFrame.plot.pie().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(3 * np.random.rand(4), índice=['a', 'b', 'c', 'd'], colunas=['x'])
 df.plot.pie(subplots=True)

Os resultados da execução são os seguintes: