English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Exemplos de operações de visualização do Pandas
A função deste Series e DataFrame é apenas uma simples envoltória ao redor do método plot() da biblioteca matplotlib.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000', periods=10), columns=list('ABCD')) df.plot()
Os resultados da execução são os seguintes:
Se o índice for composto por datas, ele chamará gct().autofmt_xdate() para formatar o eixo x, como mostrado na figura acima.
Podemos usar as chaves x e y para desenhar a relação entre uma coluna e outra.
Além do gráfico de linha padrão, os métodos de plotagem permitem usar vários estilos de plotagem. Esses métodos podem ser fornecidos como parâmetro de chave kind no plot(). Esses incluem:
Gráfico de barras Histograma Gráfico de caixa Gráfico de Área Gráfico de Dispersão Gráfico de Pizza
Vamos ver como criar um gráfico de barras:
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d']) df.plot.bar()
Os resultados da execução são os seguintes:
Gera gráficos de barras empilhadas, pode-se configurar stacked=True
import pandas as pd df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d']) df.plot.bar(stacked=True)
Os resultados da execução são os seguintes:
Para obter um gráfico de barras horizontal, pode-se usar o método barh:
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d']) df.plot.barh(stacked=True)
Os resultados da execução são os seguintes:
Pode-se usar o método plot.hist() para desenhar histogramas. Podemos especificar a quantidade.
import pandas as pd import numpy as np df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.plot.hist(bins=20)
Os resultados da execução são os seguintes:
Pode-se usar o seguinte código para desenhar histogramas diferentes para cada coluna:
import pandas as pd import numpy as np df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.diff.hist(bins=20)
Os resultados da execução são os seguintes:
Pode-se desenhar um Boxplot chamando Series.box.plot() e DataFrame.box.plot() ou DataFrame.boxplot() para visualizar a distribuição dos valores em cada coluna.
Por exemplo, este é um gráfico de caixa, representando uma variável aleatória em [0,1por exemplo, este é um gráfico de caixa, representando uma variável aleatória em10cinco testes para cinco observações.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), colunas=['A', 'B', 'C', 'D', 'E']) df.plot.box()
Os resultados da execução são os seguintes:
Você pode criar um gráfico de área usando o método Series.plot.area() ou DataFrame.plot.area().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 4), colunas=['a', 'b', 'c', 'd']) df.plot.area()
Os resultados da execução são os seguintes:
Para criar um gráfico de dispersão, você pode usar o método DataFrame.plot.scatter().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(50, 4), colunas=['a', 'b', 'c', 'd']) df.plot.scatter(x='a', y='b')
Os resultados da execução são os seguintes:
Para criar um gráfico de pizza, você pode usar o método DataFrame.plot.pie().
import pandas as pd import numpy as np df = pd.DataFrame(3 * np.random.rand(4), índice=['a', 'b', 'c', 'd'], colunas=['x']) df.plot.pie(subplots=True)
Os resultados da execução são os seguintes: