Tutorial Numpy

Troca de Bytes do NumPy Funções Aritméticas do NumPy

Funções Estatísticas do NumPy

numpy.amin() e numpy.amax()

numpy.amin() é usado para calcular o valor mínimo dos elementos do array ao longo do eixo especificado.
numpy.amax() é usado para calcular o valor máximo dos elementos do array ao longo do eixo especificado.

Exemplo

　import numpy as np　
　a = np.array([[3,7,5],[8,4,3],[2,4,9])　
　print('Nossa matriz é:', a)
　print('Chamada para a função amin():', np.amin(a,1))
　print('Chamada novamente para a função amin():', np.amin(a, 0))
　print('Chamada para a função amax():', np.amax(a))
　print('Chamada novamente para a função amax():', np.amax(a, axis=0))

O resultado é:

　Nossa matriz é: [[3　7　5])
　　[8　4　3])
　　[2　4　9]
　Chamada para a função amin(): [3　3　2])
　Chamada novamente para a função amin(): [2　4　3])
　Chamada para a função amax():　9
　Chamada novamente da função amax(): [8　7　9])

numpy.ptp()

A função numpy.ptp() calcula a diferença entre o maior e o menor valor dos elementos do array (máximo - Mínimo).

Exemplo

　import numpy as np　
　a = np.array([[3,7,5],[8,4,3],[2,4,9])　
　print('Chamada da função ptp():', np.ptp(a))
　print('Alo　1　Chamada da função ptp(): ', np.ptp(a, axis=　1))
　print('Chamada da função ptp() ao longo do eixo 0:', np.ptp(a, axis=0))

O resultado é:

　Chamada da função ptp():　7
　Alo　1　Chamada da função ptp(): [4　5　7])
　Chamada da função ptp() ao longo do eixo 0: [6　3　6])

numpy.percentile()

A percentila é uma medida usada na estatística que representa a porcentagem de observações menores que esse valor. A função numpy.percentile() aceita os seguintes parâmetros.

numpy.percentile(a, q, axis)

Descrição dos parâmetros:

a: array de entrada q: a percentila a ser calculada, em 0 ~ 100 entre axis: ao longo do qual calcular a percentila

Primeiro, defina a percentila:

A percentila p é um valor que faz pelo menos p% dos dados serem menores ou iguais a esse valor, e pelo menos (100-p)% dos dados são maiores ou iguais a esse valor.
Vamos dar um exemplo: As notas dos exames de admissão de faculdades são frequentemente relatadas em termos de percentila. Por exemplo, suponha que um candidato tenha obtido a nota original 54 Pela comparação com outros estudantes que participaram do mesmo exame, é difícil saber como ele se compara. Mas se a pontuação original54A nota exata corresponde à70 percentila, podemos saber aproximadamente70% dos estudantes tiveram notas mais baixas que ele, enquanto aproximadamente30% dos estudantes tiveram notas mais altas que ele.

Aqui, p = 70.

Exemplo

　import numpy as np　
　a = np.array([[10,　7,　4], [3,　2,　1])
　#　50% da percentila, é a mediana ordenada dentro de a
　print('Chamada da função percentile():', np.percentile(a,　50))　
　# axis é 0, na linha vertical
　print(np.percentile(a,　50, axis=0))　
　# axis é　1，na linha horizontal
　print(np.percentile(a,　50, axis=1))　
　# Manter dimensões inalteradas
　print(np.percentile(a,　50, axis=1, keepdims=True))

O resultado é:

　Chamada da função percentile():　3.5
　[6.5　4.5　2.5])
　[7.　2.]
　[[7.]
　[2.]]

numpy.median()

A função numpy.median() é usada para calcular a mediana dos elementos do array a

Exemplo

　import numpy as np　
　a = np.array([[30,65,70],[80,95,10],[50,90,60]])　
　print('Chamada da função median():', np.median(a))
　print('Alo 0: chama a função median():', np.median(a, axis = 0))
　print('Alo　1　Chama a função median():', np.median(a, axis =　1))

O resultado é:

　Chama a função median():　65.0}
　Alo 0: chama a função median(): [50.　90.　60.]
　Alo　1　Chama a função median(): [65.　80.　60.]

numpy.mean()

A função numpy.mean() retorna a média aritmética dos elementos de um array. Se fornecido, calcula ao longo do eixo especificado.
A média aritmética é a soma dos elementos ao longo do eixo dividida pelo número de elementos.

Exemplo

　import numpy as np　
　a = np.array([[1,2,3],[3,4,5],[4,5,6])　
　print('Chama a função mean():', (np.mean(a))
　print('Alo 0: chama a função mean():', np.mean(a, axis = 0))
　print('Alo　1　Chama a função mean():', np.mean(a, axis =　1))

O resultado é:

　Chama a função mean():3.6666666666666665
　Chama a função mean() alo 0: [2.66666667　3.66666667　4.66666667])
　Alo　1　Chama a função mean():[2.　4.　5.]

numpy.average()

A função numpy.average() calcula a média ponderada dos elementos de um array com base nos pesos fornecidos em outro array.
A função pode aceitar um parâmetro de eixo. Se não for especificado, o array será expandido.<
A média ponderada multiplica cada valor pelo número correspondente e soma os valores, dividindo o total pelo número total de unidades.
Considere o array[1,2,3,4], e os pesos correspondentes [4,3,2,1], somando os produtos dos elementos correspondentes e dividindo a soma pelo somatório dos pesos para calcular a média ponderada.

Média ponderada = (1*4+2*3+3*2+4*1])/(4+3+2+1])

Exemplo

　import numpy as np　
　a = np.array([1,2,3,4])　
　print('Chama a função average():', np.average(a))
　# Sem especificar pesos é equivalente à função mean
　wts = np.array([4,3,2,1])　
　print('Novamente, chama a função average():', np.average(a, weights = wts))
　# Se o parâmetro returned for definido como True, retorna a soma dos pesos　
　print('Soma dos pesos:', np.average([1,2,3,　4], weights = [4,3,2,1], returned = True))

O resultado é:

　Chama a função average():2.5
　Novamente, chama a função average():2.0}
　A soma dos pesos: (2.0,　10.0)

Em arrays multidimensionais, pode-se especificar o eixo para a computação.

Exemplo

　import numpy as np　
　a = np.arange(6).reshape(3,2])　
　wt = np.array([3,5])　
　print ('Array modificado:', np.average(a, axis =　1, weights = wt))
　print ('Array modificado:', np.average(a, axis =　1, weights = wt, returned = True))

O resultado é:

　Array modificado: [0.625　2.625　4.625])
　Array modificado: (array([0.625,　2.625,　4.625]), array([8.　8.　8.))

Desvio-padrão

O desvio-padrão é uma medida de dispersão da média de um conjunto de dados.
O desvio-padrão é a raiz quadrada da variância.
A fórmula da desvio-padrão é a seguinte:

　std = sqrt(mean((x　-　x.mean())**2))

Se o array for [1，2，3，4]，então sua média é 2.5。 Portanto, o quadrado da diferença é [2.25,0.25,0.25,2.25], e, em seguida, a raiz quadrada da média dividida por 4，ou seja, sqrt(5/4) ，o resultado é 1.1180339887498949。

Exemplo

import numpy as np　
print (np.std([1,2,3,4))

O resultado é:

1.1180339887498949

Variância

A variância em estatística (variança amostral) é a média dos quadrados dos valores individuais de cada amostra em relação à média de todos os valores da amostra, ou seja, mean((x - x.mean())** 2)。
Por outro lado, a desvio-padrão é a raiz quadrada da variância.

Exemplo

import numpy as np　
print (np.var([1,2,3,4))

1.25

Troca de Bytes do NumPy Funções Aritméticas do NumPy