Rate this post

Hôm nay chúng ta sẽ xem xét một trong những thủ tục thống kê được sử dụng thường xuyên nhất trong Lập trình SAS , đó là Phân bố Frequency SAS. Chúng ta sẽ xem cách tạo bảng phân phối tần suất trong SAS và nhiều tùy chọn khác nhau có thể được áp dụng trong khi tạo bảng để có kết quả tốt hơn.

Các bài viết liên quan:

Vì vậy, hãy bắt đầu Phân phối Frequency SAS bằng cách sử dụng SAS PROC FREQ.

Phân phối Frequency SAS

Đối với các biến liên tục, thống kê mô tả như giá trị trung bình và độ lệch chuẩn có thể được sử dụng để tóm tắt dữ liệu. Nhưng đối với các biến phân loại, các thước đo này không thích hợp.

Các biến phân loại có thể được tóm tắt bằng cách sử dụng một  bảng tần suất , cho thấy số lượng và tỷ lệ phần trăm các trường hợp được quan sát cho mỗi loại của một biến.

Biến phân loại (đôi khi được gọi là biến danh nghĩa) là biến có hai hoặc nhiều danh mục, nhưng không có thứ tự cho các danh mục. Ví dụ: giới tính là một biến phân loại có hai danh mục (nam và nữ) và không có thứ tự cho các danh mục.

Màu tóc cũng là một biến phân loại có một số loại (vàng, nâu, nâu, đỏ, v.v.) và một lần nữa, không có cách nào được thống nhất để sắp xếp các loại này từ cao nhất đến thấp nhất. Một biến phân loại thuần túy là một biến đơn giản cho phép bạn chỉ định các danh mục nhưng bạn không thể sắp xếp thứ tự các biến một cách rõ ràng.

Bảng phân phối Frequency SAS trông giống như bảng dưới đây-

Ví dụ về phân phối Frequency SAS

Xem thêm Kiểm tra Chi-Square trong SAS – SAS PROC FREQ

Quy trình SAS PROC FREQ

Thủ tục SAS PROC FREQ in tất cả các giá trị của một biến phân loại nhất định trong cửa sổ Đầu ra, cùng với số và phần trăm số lần mỗi giá trị xuất hiện. Thủ tục FREQ có thể hoạt động với cả biến phân loại chuỗi (ký tự) hoặc số .

Cú  pháp của câu lệnh SAS PROC FREQ là:

PROC FREQ DATA = Dataset ;
TABLES Variable1 ;
BY Variable2 ;

Câu lệnh PROC FREQ là câu lệnh bắt buộc duy nhất cho thủ tục FREQ.

Một bảng Frequency cơ bản được tạo bằng PROC FREQ sẽ có các thuộc tính sau:

  • Nó sẽ bao gồm tần suất, phần trăm, tần suất tích lũy và phần trăm tích lũy cho mỗi danh mục.
  • Nếu có trường hợp thiếu giá trị cho biến, số giá trị bị thiếu sẽ được đưa ra bên dưới bảng.
  • Đối với các biến chuỗi, các danh mục sẽ được sắp xếp theo thứ tự bảng chữ cái. Đối với các biến số, các danh mục sẽ được sắp xếp theo thứ tự từ chỉ số nhỏ nhất đến lớn nhất.

Cách sử dụng cơ bản của SAS PROC FREQ

Đây là dạng cơ bản nhất của PROC FREQ trong Phân phối Frequency SAS. Chúng ta chỉ cần xác định tên của tập dữ liệu chứ không phải các biến.

Thí dụ-

Proc freq data=SASHelp.cars;
Run;

Đoạn mã trên tạo một bảng tần suất cho từng biến trong tập dữ liệu.

Ví dụ: dưới đây là bảng tần suất cho biến MAKE.

Cách sử dụng cơ bản của SAS PROC FREQ

SAS PROC FREQ với tùy chọn bảng (biến đơn)

Việc sử dụng SAS Proc Freq mà không có bất kỳ tùy chọn nào thường không được khuyến nghị, đặc biệt nếu bạn có một tập dữ liệu lớn chứa các biến có nhiều giá trị (cấp) duy nhất. Câu lệnh Table sử dụng trong những trường hợp như vậy.

Thí dụ-

Proc  freq data=SASHelp.cars ;
Tables Origin;
Run;

SAS PROC FREQ – Biến đơn

Nhiều phân phối Frequency thay đổi

Nhiều bảng có thể được tạo cho nhiều biến có trong tập dữ liệu.

Thí dụ-

PROC FREQ DATA=sample;
TABLE State Rank;
RUN;

Xem thêm Fishers Exact Test trong SAS – quy trình PROC FREQ

Thiếu giá trị trong bảng tần suất

Không nhất thiết dữ liệu của chúng ta luôn phải có giá trị, đôi khi có những giá trị bị thiếu trong một dữ liệu. Khi bảng phân phối Frequency SAS tạo, nó cũng in ra số lượng giá trị còn thiếu trong biến.

Để biết tần suất, tỷ lệ phần trăm của các giá trị bị thiếu bên trong biến phân loại, chúng ta phải chỉ định nó trong câu lệnh bảng.

Thí dụ-

PROC FREQ DATA=sample;
    TABLE State Rank / MISSING;
RUN;

Thứ tự các giá trị trong bảng

Bạn có thể sử dụng SAS proc freq để xác định các giá trị phổ biến nhất hoặc ít xuất hiện nhất trong một biến.

Thí dụ-

Proc freq data=SASHelp.cars order=freq; 
Tables type origin;
Run;

Các bảng kết quả hiển thị tần suất của từng biến được sắp xếp với biến phổ biến nhất ở trên cùng và biến ít phổ biến nhất ở dưới: 

Đây là tất cả trong Hướng dẫn phân phối Frequency SAS. Hy vọng bạn thích giải thích của chúng tôi.

Sự kết luận

Do đó, chúng tôi hy vọng tất cả các bạn đã hiểu cách chúng tôi có thể sử dụng quy trình PROC FREQ để tìm phân phối Frequency SAS của các biến phân loại trong tập dữ liệu của chúng tôi.

Xem thêm Hướng dẫn về PROC SQL trong SAS

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now