Numpy cung cấp các chức năng thống kê khác nhau được sử dụng để thực hiện một số phân tích dữ liệu thống kê. Trong phần này của hướng dẫn, chúng ta sẽ thảo luận về các hàm thống kê được cung cấp bởi numpy.
Các bài viết liên quan:
numpy.Min()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm min()
trong NumPy để tìm giá trị nhỏ nhất:
Cú pháp:
numpy.min(arr, axis=None)
arr
: Mảng đầu vào để tìm giá trị nhỏ nhất.axis
(tùy chọn): Trục hoặc trục tổng quát mà giá trị nhỏ nhất sẽ được tìm trên. Mặc định là None, nghĩa là tìm giá trị nhỏ nhất của toàn bộ mảng.
Ví dụ:
import numpy as np arr = np.array([3, 2, 8, 5, 1]) min_value = np.min(arr) print("Mảng đầu vào:", arr) print("Giá trị nhỏ nhất:", min_value)
Kết quả:
Mảng đầu vào: [3 2 8 5 1] Giá trị nhỏ nhất: 1
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 3 đến 1. Bằng cách sử dụng hàm min()
của NumPy, chúng ta tìm giá trị nhỏ nhất trong mảng này và lưu kết quả vào biến min_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị nhỏ nhất. Kết quả cho thấy giá trị nhỏ nhất trong mảng là 1.
Xem thêm numpy.array() trong numPy
numpy.max()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm max()
trong NumPy để tìm giá trị lớn nhất:
Cú pháp:
numpy.max(arr, axis=None)
arr
: Mảng đầu vào để tìm giá trị lớn nhất.axis
(tùy chọn): Trục hoặc trục tổng quát mà giá trị lớn nhất sẽ được tìm trên. Mặc định là None, nghĩa là tìm giá trị lớn nhất của toàn bộ mảng.
Ví dụ:
import numpy as np arr = np.array([3, 2, 8, 5, 1]) max_value = np.max(arr) print("Mảng đầu vào:", arr) print("Giá trị lớn nhất:", max_value)
Kết quả:
Mảng đầu vào: [3 2 8 5 1] Giá trị lớn nhất: 8
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 3 đến 1. Bằng cách sử dụng hàm max()
của NumPy, chúng ta tìm giá trị lớn nhất trong mảng này và lưu kết quả vào biến max_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị lớn nhất. Kết quả cho thấy giá trị lớn nhất trong mảng là 8.
Xem thêm Định lý giá trị trung bình của Lagrange
Hàm numpy.ptp ()
Tên của hàm numpy.ptp () được lấy từ tên từ đỉnh đến đỉnh. Nó được sử dụng để trả về phạm vi giá trị dọc theo trục. Hãy xem xét ví dụ sau.
Thí dụ
import numpy as np a = np.array([[2,10,20],[80,43,31],[22,43,10]]) print("Original array:\n",a) print("\nptp value along axis 1:",np.ptp(a,1)) print("ptp value along axis 0:",np.ptp(a,0))
Output:
Xem thêm numpy.mean() trong Python
Hàm numpy.percentile ()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm percentile()
trong NumPy để tính phân vị:
Cú pháp:
numpy.percentile(arr, q, axis=None)
arr
: Mảng đầu vào để tính phân vị.q
: Giá trị phân vị cần tính. Có thể là một giá trị đơn hoặc một mảng các giá trị phân vị.axis
(tùy chọn): Trục hoặc trục tổng quát mà phân vị sẽ được tính toán trên. Mặc định là None, nghĩa là tính phân vị của toàn bộ mảng.
Ví dụ:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) percentile_value = np.percentile(arr, 75) print("Mảng đầu vào:", arr) print("Phân vị 75%:", percentile_value)
Kết quả:
Mảng đầu vào: [1 2 3 4 5] Phân vị 75%: 4.0
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm percentile()
của NumPy và truyền vào giá trị 75, chúng ta tính phân vị 75% của mảng này và lưu kết quả vào biến percentile_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị phân vị 75%. Kết quả cho thấy giá trị phân vị 75% của mảng là 4.0.
Xem thêm Bình phương trong c++
Hàm numpy.median ():
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm median()
trong NumPy để tính trung vị:
Cú pháp:
numpy.median(arr, axis=None)
arr
: Mảng đầu vào để tính trung vị.axis
(tùy chọn): Trục hoặc trục tổng quát mà trung vị sẽ được tính toán trên. Mặc định là None, nghĩa là tính trung vị của toàn bộ mảng.
Ví dụ:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) median_value = np.median(arr) print("Mảng đầu vào:", arr) print("Trung vị:", median_value)
Kết quả:
Mảng đầu vào: [1 2 3 4 5] Trung vị: 3.0
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm median()
của NumPy, chúng ta tính trung vị của mảng này và lưu kết quả vào biến median_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị trung vị. Kết quả cho thấy giá trị trung vị của mảng là 3.0.
Xem thêm Mean Squared Error
Hàm numpy.mean ():
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm mean()
trong NumPy để tính trung bình:
Cú pháp:
numpy.mean(arr, axis=None, dtype=None, keepdims=False)
arr
: Mảng đầu vào để tính trung bình.axis
(tùy chọn): Trục hoặc trục tổng quát mà trung bình sẽ được tính toán trên. Mặc định là None, nghĩa là tính trung bình của toàn bộ mảng.dtype
(tùy chọn): Kiểu dữ liệu của kết quả trung bình. Mặc định là None, nghĩa là sử dụng kiểu dữ liệu của mảng đầu vào.keepdims
(tùy chọn): Xác định xem kích thước của các trục bị giữ lại trong kết quả hay không. Mặc định là False, nghĩa là kích thước của các trục bị giảm xuống.
Ví dụ:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) mean_value = np.mean(arr) print("Mảng đầu vào:", arr) print("Trung bình:", mean_value)
Kết quả:
Mảng đầu vào: [1 2 3 4 5] Trung bình: 3.0
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm mean()
của NumPy, chúng ta tính trung bình của mảng này và lưu kết quả vào biến mean_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị trung bình. Kết quả cho thấy giá trị trung bình của mảng là 3.0.
Xem thêm Hướng dẫn SAS PROC MEANS giá trị trung bình số học trong SAS
numpy.std()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm std()
trong NumPy để tính độ lệch chuẩn:
Cú pháp:
numpy.std(arr, axis=None, dtype=None, ddof=0)
arr
: Mảng đầu vào để tính độ lệch chuẩn.axis
(tùy chọn): Trục hoặc trục tổng quát mà độ lệch chuẩn sẽ được tính toán trên. Mặc định là None, nghĩa là tính độ lệch chuẩn của toàn bộ mảng.dtype
(tùy chọn): Kiểu dữ liệu của kết quả độ lệch chuẩn. Mặc định là None, nghĩa là sử dụng kiểu dữ liệu của mảng đầu vào.ddof
(tùy chọn): Số tự do hiệu chỉnh. Mặc định là 0, nghĩa là tính độ lệch chuẩn không điều chỉnh.
Ví dụ:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) std_value = np.std(arr) print("Mảng đầu vào:", arr) print("Độ lệch chuẩn:", std_value)
Kết quả:
Mảng đầu vào: [1 2 3 4 5] Độ lệch chuẩn: 1.4142135623730951
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm std()
của NumPy, chúng ta tính độ lệch chuẩn của mảng này và lưu kết quả vào biến std_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị độ lệch chuẩn. Kết quả cho thấy độ lệch chuẩn của mảng là 1.4142135623730951.
numpy.var()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm var()
trong NumPy để tính phương sai:
Cú pháp:
numpy.var(arr, axis=None, dtype=None, ddof=0)
arr
: Mảng đầu vào để tính phương sai.axis
(tùy chọn): Trục hoặc trục tổng quát mà phương sai sẽ được tính toán trên. Mặc định là None, nghĩa là tính phương sai của toàn bộ mảng.dtype
(tùy chọn): Kiểu dữ liệu của kết quả phương sai. Mặc định là None, nghĩa là sử dụng kiểu dữ liệu của mảng đầu vào.ddof
(tùy chọn): Số tự do hiệu chỉnh. Mặc định là 0, nghĩa là tính phương sai không điều chỉnh.
Ví dụ:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) var_value = np.var(arr) print("Mảng đầu vào:", arr) print("Phương sai:", var_value)
Kết quả:
Mảng đầu vào: [1 2 3 4 5] Phương sai: 2.5
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm var()
của NumPy, chúng ta tính phương sai của mảng này và lưu kết quả vào biến var_value
. Sau đó, chúng ta in ra mảng đầu vào và giá trị phương sai. Kết quả cho thấy phương sai của mảng là 2.5.
Xem thêm NumPy Datatypes trong thư viện NumPy
numpy.histogram
()
Dưới đây là cú pháp và ví dụ về cách sử dụng hàm histogram()
trong NumPy để tính histogram:
Cú pháp:
numpy.histogram(a, bins=10, range=None, normed=False, weights=None, density=None)
a
: Mảng đầu vào để tính histogram.bins
(tùy chọn): Số lượng bin (ngăn xếp) trong histogram. Mặc định là 10.range
(tùy chọn): Khoảng giá trị của dữ liệu. Mặc định là None, nghĩa là sử dụng khoảng giá trị của mảng đầu vào.normed
(tùy chọn): Cho phép chuẩn hóa tổng diện tích histogram thành 1. Mặc định là False.weights
(tùy chọn): Trọng số tương ứng với mỗi mục trong mảng đầu vào.density
(tùy chọn): Tương tự nhưnormed
, nhưng được khuyến nghị sử dụng thay thế.
Ví dụ:
import numpy as np arr = np.array([1, 2, 2, 3, 3, 3, 4, 4, 5]) hist, bins = np.histogram(arr, bins=5) print("Mảng đầu vào:", arr) print("Histogram:", hist) print("Bins:", bins)
Kết quả:
Mảng đầu vào: [1 2 2 3 3 3 4 4 5] Histogram: [1 2 3 2 1] Bins: [1. 1.8 2.6 3.4 4.2 5. ]
Trong ví dụ trên, chúng ta có một mảng arr
chứa các giá trị từ 1 đến 5. Bằng cách sử dụng hàm histogram()
của NumPy và truyền vào số lượng bin là 5, chúng ta tính histogram của mảng này. Kết quả là một mảng hist
chứa các giá trị tương ứng với số lượng mục trong mỗi bin, và một mảng bins
chứa các giới hạn của các bin. Sau đó, chúng ta in ra mảng đầu vào, histogram và bins tương ứng. Kết quả cho thấy histogram và bins của mảng.
Xem thêm Cách cài đặt NumPy trên Python