Hôm nay chúng ta sẽ xem xét SAS Cross Tabulation và cách tạo các bảng thay đổi trong Lập trình SAS bằng cách sử dụng câu lệnh SAS Table.
Chúng ta cũng sẽ thấy một cú pháp cho Lập bảng chéo trong SAS, một loạt các tùy chọn như bảng chéo với 3 biến, sắp xếp và liệt kê một bảng chéo và sử dụng các câu lệnh nocol và norow.
Các bài viết liên quan:
Vì vậy, hãy bắt đầu Lập bảng chéo SAS.
Lập bảng chéo SAS là gì
Lập bảng chéo cho chúng ta biết mối quan hệ giữa hai biến. Lập bảng chéo trong SAS là một trong những công cụ phân tích hữu ích nhất. Bước đầu tiên trong việc phân tích các biến phân loại là tạo một bảng lập bảng chéo SAS, có thể được thực hiện bằng cách sử dụng câu lệnh TABLES.
Bạn có thể sử dụng câu lệnh SAS TABLE để tạo bảng tần suất một chiều n. Không sử dụng câu lệnh TABLES, SAS PROC FREQ sẽ tạo bảng một chiều cho tất cả các biến không được liệt kê trong các câu lệnh khác.
Các biến được sử dụng trong câu lệnh TABLES có thể là số hoặc phân loại vì PROC FREQ coi tất cả các biến là phân loại.
Đây là cách một bảng phân tích chéo SAS trông như thế nào-
Ví dụ về lập bảng chéo SAS
Cú pháp lập bảng chéo trong SAS
PROC FREQ DATA = dataset; TABLES variable1*Variable2;
Các yêu cầu trong câu lệnh SAS TABLES có thể là một tên biến hoặc danh sách các tên biến được phân tách bằng dấu hoa thị. Ví dụ, để tạo bảng tần suất một chiều, chỉ cần sử dụng một tên biến; để tạo bảng tần suất hai chiều, hãy viết dấu hoa thị giữa hai biến.
Yêu cầu | Tương đương |
Bảng A * (BC); | Bảng A * BA * C; |
Bảng (AB) * (CD); | Các bảng A * CB * CA * DB * D; |
Bảng (ABC) * D; | Bảng A * DB * DC * D; |
Các bảng A – – C; | Bảng ABC; |
Bảng (A – – C) * D; | Bảng A * DB * DC * D; |
Tùy chọn cho câu lệnh TABLES
- LIST Các bảng N-way được tạo ở định dạng danh sách
- NOFREQ Loại bỏ tần số
- NOCUM loại bỏ tần số và tỷ lệ tích lũy
- NOPERCENT loại bỏ tỷ lệ phần trăm
- NOCOL Loại bỏ tỷ lệ phần trăm cột
- NOROW Loại bỏ tỷ lệ phần trăm hàng
- MISSING Xử lý các giá trị bị thiếu dưới dạng một nhóm
Các bài viết cùng chủ đề khác:
- Tách và trích tập dữ liệu trong SAS
- Kiểm tra Chi-Square trong SAS – SAS PROC FREQ
- Sử dụng T-Test trong SAS
- Phân phối Frequency trong SAS
- Concatenate( nối ) dữ liệu trong SAS
- Hướng dẫn SAS PROC MEANS giá trị trung bình số học trong SAS
- 8 cuốn sách tự học SAS hay nhất
- Fishers Exact Test trong SAS – quy trình PROC FREQ
- Nghề nghiệp của ngôn ngữ SAS – Phạm vi và loại công việc
Lập bảng chéo SAS của hai biến
SAS Proc freq có thể được sử dụng để tạo ra các bảng 2 × 2 để xác định sự phân bố (hoặc tần suất) của các bản ghi thuộc 2 tổ hợp loại.
Thí dụ-
Proc freq data=SASHelp.cars; Tables origin*drivetrain; Run;
Lập bảng chéo SAS
Trong ví dụ về Lập bảng chéo SAS này, cả Origin và DriveTrain đều có 3 giá trị có thể có. Kết quả là, lập bảng chéo SAS tạo ra một bảng 3 × 3 bao gồm tổng cộng 9 kết hợp (tức là 3 × 3 = 9): Như được hiển thị ở trên, là các tần số.
Ví dụ: số 34 ở ô trên cùng bên trái cho biết có 34 ô tô từ Châu Á có “Tất cả” cho DriveTrain.
Di chuyển từ trái sang phải, số 99 ở hộp trên cùng ở giữa cho biết có 99 xe ô tô từ Châu Á có hệ thống dẫn động “Phía trước”, v.v.
Hàng thứ hai chứa tỷ lệ phần trăm so với 8 kết hợp khác. Sử dụng lại hộp trên cùng bên trái làm ví dụ, 7,94% chỉ ra rằng trong số 9 sự kết hợp có thể có của Origin và DriveTrain, 7,94% bản ghi có Origin = Asia và DriveTrain = All.
Hàng thứ ba chứa những gì được gọi là phần trăm hàng. Bắt đầu với hộp trên cùng bên trái làm ví dụ, 21,52 cho biết rằng trong số các bản ghi có Origin = Asia, 21,52% có DriveTrain = Tất cả.
Di chuyển qua hàng từ trái sang phải, bạn có thể thấy rằng đối với Xe xuất xứ = xe Châu Á, 62,66% có DriveTrain = Phía trước và 15,82% có DriveTrain = Phía sau. Lưu ý rằng 3 tỷ lệ phần trăm này tổng cộng là 100% khi được tổng hợp (cộng lại với nhau) trên toàn hàng.
Hàng thứ tư chứa những gì được gọi là phần trăm cột. Bắt đầu với hộp trên cùng bên trái làm ví dụ, 36,96 cho biết rằng trong số các bản ghi đó có DriveTrain = Tất cả , 36,96% có Xuất xứ = Châu Á.
Di chuyển xuống cột từ trái sang phải, bạn có thể thấy rằng đối với DriveTrain = Tất cả ô tô, 39,13% có Xuất xứ = Châu Âu và 23,91% có Xuất xứ = Hoa Kỳ. Lưu ý rằng 3 tỷ lệ phần trăm này tổng cộng là 100% khi được tổng hợp (cộng với nhau) xuống cột.
Giới hạn đầu ra
Tùy thuộc vào kết quả mong muốn, bạn có thể chọn loại bỏ một số con số này khỏi đầu ra.
Các tùy chọn NOCOL, NOROW, NOFREQ và NOPERCENT có thể sử dụng để loại bỏ phần trăm cột, phần trăm hàng, tần số và phần trăm tổng thể từ đầu ra của bạn. Các tùy chọn này có thể được sử dụng độc lập hoặc kết hợp khác nhau với nhau.
Thí dụ-
Proc freq data=SASHelp.cars; Tables origin*drivetrain / nocol norow; Run;
Lập bảng chéo SAS
Lập bảng chéo SAS của n biến
Đối với phân tích tần suất của nhiều hơn hai biến, chúng ta có thể sử dụng thủ tục FREQ để tạo bảng lập bảng chéo n chiều . Trong trường hợp đó, một loạt các bảng hai chiều sẽ tạo ra, với một bảng cho mỗi cấp của các biến khác. Ví dụ sau tạo một bảng ba chiều về giới tính , job_chng và ed_level :
Thí dụ-
PROC FREQ data=sashelp.class; Tables sex*job_chng*ed_level; RUN;
Như bạn thấy, để yêu cầu SAS tạo một bảng ba chiều giới tính , job_chng và ed_level , chúng tôi sử dụng dấu hoa thị (*) để nối ba biến trong câu lệnh TABLES. Thứ tự của các biến là quan trọng.
Trong bảng n chiều, hai biến cuối cùng của câu lệnh TABLES trở thành các hàng và cột của bảng hai chiều.
Vì vậy, trong trường hợp này, chúng ta nên mong đợi SAS tạo ra hai bảng hai chiều job_chng và ed_level , một bảng cho khi sex = 1 và một cho khi sex = 2.
Lập bảng chéo SAS
Lập bảng chéo SAS
Đây là tất cả trong Hướng dẫn lập bảng chéo SAS. Hy vọng bạn thích giải thích của chúng tôi.
Sự kết luận
Hy vọng tất cả các bạn đã hiểu cách chúng ta có thể sử dụng thủ tục PROC FREQ để tạo bảng SAS Cross Tabulation. Chúng tôi cũng đã thấy làm thế nào chúng tôi có thể giới hạn đầu ra bằng cách sử dụng các câu lệnh của Bảng SAS như nocol và norow.