Cho đến bây giờ chúng ta đã xem xét cách biểu diễn dữ liệu và các phép toán khác nhau có thể được áp dụng cho tập dữ liệu.
Bây giờ trở đi, chúng ta sẽ thảo luận về các thủ tục thống kê khác nhau có thể được áp dụng cho tập dữ liệu của chúng ta bắt đầu từ trung bình số học SAS với SAS PROC MEANS. Chúng tôi cũng thấy một số ví dụ về SAS PROC MEANS.
Các bài viết liên quan:
Vì vậy, hãy bắt đầu với SAS Arithmetic Mean.
SAS Arithmetic Mean là gì
Trung bình số học SAS là tổng các giá trị của một biến số trong tập dữ liệu chia cho tổng số quan sát.
Ví dụ về trung bình số học SAS
Xem thêm numpy.mean() trong Python
Thủ tục SAS PROC MEANS
Chúng tôi đã sử dụng SAS PROC MEANS để tìm trung bình cộng của dữ liệu của chúng tôi. PROC MEANS tạo ra thống kê mô tả (trung bình, độ lệch chuẩn, tối thiểu, tối đa, v.v.) cho các biến số trong một tập hợp dữ liệu.
Cú pháp của SAS PROC MEANS là:
PROC MEANS <options>; <statements>;
Các tùy chọn thống kê có thể được yêu cầu là: (số liệu thống kê mặc định được gạch dưới.)
- N – Số lần quan sát
- NMISS – Số lượng quan sát bị thiếu
- MEAN – Trung bình số học)
- STD – Độ lệch chuẩn
- MIN – Minimum (nhỏ nhất)
- MAX – Tối đa (lớn nhất)
- RANGE – Phạm vi
- SUM – Tổng số quan sát
- VAR – Phương sai
Các tùy chọn thường được sử dụng khác có sẵn trong SAS PROC MEANS bao gồm:
- DATA = Chỉ định tập dữ liệu để sử dụng
- NOPRINT Không in đầu ra
- MAXDEC = n Sử dụng n chữ số thập phân để in đầu ra
Các câu lệnh thường được sử dụng với SAS PROC MEANS bao gồm:
- BY variable list – Thống kê được báo cáo cho các nhóm trong các bảng riêng biệt
- CLASS variable list – Thống kê được báo cáo bởi các nhóm trong một bảng duy nhất
- VAR variable list – chỉ định biến số nào sẽ sử dụng
- OUTPUT OUT = tên tập dữ liệu – thống kê sẽ được xuất ra tệp dữ liệu SAS
- FREQ variable – chỉ định một biến đại diện cho số lượng quan sát
Xem thêm Hướng dẫn về PROC SQL trong SAS
Trung bình số học SAS của toàn bộ tập dữ liệu
Đây là hình thức cơ bản nhất của SAS PROC MEANS. Chúng ta chỉ cần xác định tên của tập dữ liệu chứ không phải các biến.
Thí dụ-
Proc Means Data=SASHelp.cars; Run;
Dạng cơ bản của SAS PROC MEANS tính toán một tập hợp các thống kê mô tả. Thống kê mô tả được tính toán cho tất cả các biến số trong tập dữ liệu.
Ví dụ về SAS PROC MEANS
Theo mặc định, các thống kê N, Trung bình, Độ lệch Chuẩn , Tối thiểu và Tối đa được tính toán.
Hiển thị các vị trí thập phân khác nhau
Bạn cũng có thể chỉ định số lượng vị trí thập phân bạn muốn hiển thị bằng cách sử dụng tùy chọn MAXDEC =.
Thí dụ-
Proc Means Data=SASHelp.cars maxdec=0; Var MSRP Invoice; Run;
Trung bình số học SAS – Hiển thị vị trí thập phân
proc Means Data=SASHelp.cars maxdec=2; Var MSRP Invoice; Run;
Trung bình số học SAS – Hiển thị 2 vị trí thập phân
SAS Trung bình số học của các biến cụ thể
Đôi khi bạn có thể chỉ quan tâm đến một vài biến được chọn cho phân tích của mình. Bạn có thể thêm câu lệnh VAR để giới hạn phân tích chỉ với các biến mà bạn quan tâm.
Câu lệnh VAR bên dưới giới hạn phân tích chỉ với các biến MSRP và INVOICE. Không có kết quả nào được tính cho bất kỳ biến nào khác trong tập dữ liệu.
Thí dụ-
Proc Means Data=SASHelp.cars; Var MSRP Invoice; Run;
Trung bình số học SAS của các biến cụ thể – Ví dụ
Trung bình số học SAS của các biến cụ thể – Đầu ra
Trung bình số học SAS theo Class
Mọi biến số đều khác nhau về một số khía cạnh, giống như trong tập dữ liệu về ô tô, giá của một chiếc Porsche có thể sẽ rất khác so với giá của Toyota. Vì vậy, sẽ có ý nghĩa hơn nếu phân tích riêng cho từng hãng xe. Một câu lệnh CLASS có thể được thêm vào thủ tục MEANS để nhóm phân tích của bạn.
Trong ví dụ dưới đây, Bằng cách chỉ định biến MAKE làm biến phân loại, sẽ có một phân tích riêng được hoàn thành cho từng nhà sản xuất ô tô.
Thí dụ-
Proc Means Data=SASHelp.cars;Class Make; Var MSRP Invoice; Run;
Trung bình số học SAS theo LỚP – Ví dụ
Trung bình số học SAS theo LỚP – Kết quả
Đây là tất cả về Hướng dẫn SAS Arithematic Mean. Hy vọng bạn thích giải thích của chúng tôi về SAS PROC MEANS.
Sự kết luận
Do đó, chúng tôi hy vọng tất cả các bạn đã hiểu cách chúng tôi có thể sử dụng thủ tục SAS PROC MEANS để tìm trung bình cộng SAS của tập dữ liệu của chúng tôi, làm thế nào chúng tôi có thể chỉ định các biến mà chúng tôi muốn.