English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Funções Estatísticas do NumPy

numpy.amin() e numpy.amax()

numpy.amin() é usado para calcular o valor mínimo dos elementos do array ao longo do eixo especificado.
numpy.amax() é usado para calcular o valor máximo dos elementos do array ao longo do eixo especificado.

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Nossa matriz é:', a)
 print('Chamada para a função amin():', np.amin(a,1))
 print('Chamada novamente para a função amin():', np.amin(a, 0))
 print('Chamada para a função amax():', np.amax(a))
 print('Chamada novamente para a função amax():', np.amax(a, axis=0))

O resultado é:

 Nossa matriz é: [[3 7 5])
  [8 4 3])
  [2 4 9]
 Chamada para a função amin(): [3 3 2])
 Chamada novamente para a função amin(): [2 4 3])
 Chamada para a função amax(): 9
 Chamada novamente da função amax(): [8 7 9])

numpy.ptp()

A função numpy.ptp() calcula a diferença entre o maior e o menor valor dos elementos do array (máximo - Mínimo).

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Chamada da função ptp():', np.ptp(a))
 print('Alo 1 Chamada da função ptp(): ', np.ptp(a, axis= 1))
 print('Chamada da função ptp() ao longo do eixo 0:', np.ptp(a, axis=0))

O resultado é:

 Chamada da função ptp(): 7
 Alo 1 Chamada da função ptp(): [4 5 7])
 Chamada da função ptp() ao longo do eixo 0: [6 3 6])

numpy.percentile()

A percentila é uma medida usada na estatística que representa a porcentagem de observações menores que esse valor. A função numpy.percentile() aceita os seguintes parâmetros.

numpy.percentile(a, q, axis)

Descrição dos parâmetros:

a: array de entrada q: a percentila a ser calculada, em 0 ~ 100 entre axis: ao longo do qual calcular a percentila

Primeiro, defina a percentila:

A percentila p é um valor que faz pelo menos p% dos dados serem menores ou iguais a esse valor, e pelo menos (100-p)% dos dados são maiores ou iguais a esse valor.
Vamos dar um exemplo: As notas dos exames de admissão de faculdades são frequentemente relatadas em termos de percentila. Por exemplo, suponha que um candidato tenha obtido a nota original 54 Pela comparação com outros estudantes que participaram do mesmo exame, é difícil saber como ele se compara. Mas se a pontuação original54A nota exata corresponde à70 percentila, podemos saber aproximadamente70% dos estudantes tiveram notas mais baixas que ele, enquanto aproximadamente30% dos estudantes tiveram notas mais altas que ele.

Aqui, p = 70.

 import numpy as np 
 a = np.array([[10, 7, 4], [3, 2, 1])
 # 50% da percentila, é a mediana ordenada dentro de a
 print('Chamada da função percentile():', np.percentile(a, 50)) 
 # axis é 0, na linha vertical
 print(np.percentile(a, 50, axis=0)) 
 # axis é 1,na linha horizontal
 print(np.percentile(a, 50, axis=1)) 
 # Manter dimensões inalteradas
 print(np.percentile(a, 50, axis=1, keepdims=True))

O resultado é:

 Chamada da função percentile(): 3.5
 [6.5 4.5 2.5])
 [7. 2.]
 [[7.]
 [2.]]

numpy.median()

A função numpy.median() é usada para calcular a mediana dos elementos do array a

 import numpy as np 
 a = np.array([[30,65,70],[80,95,10],[50,90,60]]) 
 print('Chamada da função median():', np.median(a))
 print('Alo 0: chama a função median():', np.median(a, axis = 0))
 print('Alo 1 Chama a função median():', np.median(a, axis = 1))

O resultado é:

 Chama a função median(): 65.0}
 Alo 0: chama a função median(): [50. 90. 60.]
 Alo 1 Chama a função median(): [65. 80. 60.]

numpy.mean()

A função numpy.mean() retorna a média aritmética dos elementos de um array. Se fornecido, calcula ao longo do eixo especificado.
A média aritmética é a soma dos elementos ao longo do eixo dividida pelo número de elementos.

 import numpy as np 
 a = np.array([[1,2,3],[3,4,5],[4,5,6]) 
 print('Chama a função mean():', (np.mean(a))
 print('Alo 0: chama a função mean():', np.mean(a, axis = 0))
 print('Alo 1 Chama a função mean():', np.mean(a, axis = 1))

O resultado é:

 Chama a função mean():3.6666666666666665
 Chama a função mean() alo 0: [2.66666667 3.66666667 4.66666667])
 Alo 1 Chama a função mean():[2. 4. 5.]

numpy.average()

A função numpy.average() calcula a média ponderada dos elementos de um array com base nos pesos fornecidos em outro array.
A função pode aceitar um parâmetro de eixo. Se não for especificado, o array será expandido.<
A média ponderada multiplica cada valor pelo número correspondente e soma os valores, dividindo o total pelo número total de unidades.
Considere o array[1,2,3,4], e os pesos correspondentes [4,3,2,1], somando os produtos dos elementos correspondentes e dividindo a soma pelo somatório dos pesos para calcular a média ponderada.

Média ponderada = (1*4+2*3+3*2+4*1])/(4+3+2+1])
 import numpy as np 
 a = np.array([1,2,3,4]) 
 print('Chama a função average():', np.average(a))
 # Sem especificar pesos é equivalente à função mean
 wts = np.array([4,3,2,1]) 
 print('Novamente, chama a função average():', np.average(a, weights = wts))
 # Se o parâmetro returned for definido como True, retorna a soma dos pesos 
 print('Soma dos pesos:', np.average([1,2,3, 4], weights = [4,3,2,1], returned = True))

O resultado é:

 Chama a função average():2.5
 Novamente, chama a função average():2.0}
 A soma dos pesos: (2.0, 10.0)

Em arrays multidimensionais, pode-se especificar o eixo para a computação.

 import numpy as np 
 a = np.arange(6).reshape(3,2]) 
 wt = np.array([3,5]) 
 print ('Array modificado:', np.average(a, axis = 1, weights = wt))
 print ('Array modificado:', np.average(a, axis = 1, weights = wt, returned = True))

O resultado é:

 Array modificado: [0.625 2.625 4.625])
 Array modificado: (array([0.625, 2.625, 4.625]), array([8. 8. 8.))

Desvio-padrão

O desvio-padrão é uma medida de dispersão da média de um conjunto de dados.
O desvio-padrão é a raiz quadrada da variância.
A fórmula da desvio-padrão é a seguinte:

 std = sqrt(mean((x - x.mean())**2))

Se o array for [1,2,3,4],então sua média é 2.5。 Portanto, o quadrado da diferença é [2.25,0.25,0.25,2.25], e, em seguida, a raiz quadrada da média dividida por 4,ou seja, sqrt(5/4) ,o resultado é 1.1180339887498949。

import numpy as np 
print (np.std([1,2,3,4))

O resultado é:

1.1180339887498949

Variância

A variância em estatística (variança amostral) é a média dos quadrados dos valores individuais de cada amostra em relação à média de todos os valores da amostra, ou seja, mean((x - x.mean())** 2)。
Por outro lado, a desvio-padrão é a raiz quadrada da variância.

import numpy as np 
print (np.var([1,2,3,4))
1.25