English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Operações básicas do Pandas Series
Estrutura da Series如下:
pandas.Series( data, index, dtype, copy)
Os parâmetros do construtor são os seguintes-
data: os dados podem ser em várias formas, como ndarray, lista, constante index: os valores de índice devem ser únicos e hasháveis, e o comprimento deve coincidir com os dados. Se o índice não for passado, o padrão é np.arange(n). dtype: dtype usado para o tipo de dados. Se for None, o tipo de dados será inferido copy: copiar dados. O padrão é falso
Pode-se criar Series com várias entradas, por exemplo
Array Dicionário Valores escalares ou constantes
>>> # Importar o pacote dependente pandas e usar um alias >>> import pandas as pd >>> s = pd.Series() >>> print(s) Series([], dtype: float64)
Se os dados forem ndarray, o índice passado deve ter o mesmo comprimento. Se o índice não for passado, por padrão, o índice será range(n), onde n é o comprimento do array, ou seja, [0,1,2,3…。faixa (len(array))-1]。
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data) print(s)
Resultados da Execução:
0 a 1 b 2 c 3 d dtype: object
Nenhum índice foi passado, então, por padrão, ele atribui o intervalo de índice de 0 a len(data)-1,ou seja, de 0 a3。
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data,index=[100,101,102,103]) print(s)
Resultados da Execução:
100 a 101 b 102 c 103 d dtype: object
Nós passamos o valor do índice aqui. Agora, podemos ver os valores do índice personalizados na saída.
O dicionário pode ser passado como entrada. Se o índice não for especificado, todas as chaves do dicionário são usadas para construir o índice na ordem de classificação. Se o índice for passado, os valores correspondentes aos rótulos de índice serão extraídos.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd import numpy as np data = {'a' : 0., 'b' : 1., 'c' : 2.} s = pd.Series(data) print(s)
Resultados da Execução:
a 0.0 b 1.0 c 2.0 dtype: float64
As chaves do dicionário são usadas para construir o índice.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd import numpy as np data = {
Resultados da Execução:
b 1.0 c 2.0 d NaN a 0.0 dtype: float64
A ordem dos índices é mantida, e os elementos perdidos são preenchidos com NaN (não numérico).
Se os dados forem valores escalares, deve ser fornecida uma índice. Este valor será repetido para coincidir com o comprimento do índice
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd import numpy as np s = pd.Series(5, index=[0, 1, 2, 3]) print(s)
Resultados da Execução:
0 5 1 5 2 5 3 5 dtype: int64
Os dados da Series podem ser acessados como se fossem um ndarray.
Procurar o primeiro elemento. Conhecido, o contagem do array começa do zero, o que significa que o primeiro elemento é armazenado na posição zero, e assim por diante.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Procurar o primeiro dado print s[0]
Resultados da Execução:
1
Procurar os três primeiros elementos da Series. Se forem inseridos antes, todos os itens a partir daquele índice serão extraídos. Se forem usados dois parâmetros (separados por dois pontos), os itens entre os dois índices (não incluindo o índice final)
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Procurar os primeiros3elementos print s[:3]
Resultados da Execução:
a 1 b 2 c 3 dtype: int64
Procurar os três últimos elementos.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Procurar os três últimos elementos print s[-3:]
Resultados da Execução:
c 3 d 4 e 5 dtype: int64
A Series é como um dicionário de tamanho fixo, e pode obter e definir valores através de rótulos de índice.
Procurar um único elemento usando o valor de rótulo de índice.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd s = pd.Series([1,2,3,4,5], index = [
Resultados da Execução:
1
Procurar múltiplos elementos usando a lista de valores de rótulo de índice.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd s = pd.Series([1,2,3,4,5], index = [
Resultados da Execução:
a 1 c 3 d 4 dtype: int64
Se não contiver rótulos, será gerada uma exceção.
# Nome do Arquivo: pandas.py # author by: pt.oldtoolbag.com # Importar pacote dependente pandas e definir alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Procurar múltiplos elementos print(s['f'])
Resultados da Execução:
… KeyError: 'f'