Bây giờ, chúng ta sẽ học cách có thể trích xuất một số phần của tập dữ liệu để sử dụng bằng cách sử dụng các câu lệnh như IF, WHERE, DROP và KEEP.
Các bài viết liên quan:
Các câu lệnh này khi được áp dụng cho tập dữ liệu, chỉ giúp chúng tôi trích xuất các biến và quan sát mà chúng tôi quan tâm. Ở đây, chúng ta sẽ nghiên cứu tập dữ liệu con trong SAS là gì, tập dữ liệu tách SAS theo biến và tập dữ liệu tách SAS theo quan sát; SAS đặt con câu lệnh WHERE & Câu lệnh IF.
Xem thêm First. và Last. Biến trong SAS – Cách chọn biến
Đặt tập dữ liệu con trong SAS
Chúng tôi gặp các loại tập dữ liệu khác nhau trong SAS và nhiều lần chúng tôi muốn chỉ có một phần của tập dữ liệu có thể hữu ích. Giả sử chúng tôi chỉ muốn các ngày sau ngày 1 tháng 4 năm 2011, tất cả các ngày trước ngày này không phải là mối quan tâm của chúng tôi.
Sau đó, tính năng đặt tập dữ liệu con trong SAS, giúp chúng tôi chỉ trích xuất dữ liệu có liên quan đến chúng tôi, do đó cải thiện phân tích của chúng tôi. Việc thiết lập con có thể đạt được bằng cách trích xuất các cột hoặc hàng (quan sát) mà chúng ta lựa chọn.
Xem thêm Tìm hiểu về lập trình SAS
Biến tập hợp con SAS
Bạn có thể tạo tập dữ liệu mới chỉ với một tập hợp con của các biến trong tập dữ liệu ban đầu bằng cách sử dụng câu lệnh keep hoặc drop.
Giả sử bạn chỉ muốn in ba trong số các biến trong tập dữ liệu này: id nghiên cứu, tuổi và chiều cao.
data one; input studyid name $ sex $ age weight height; cards; 1 Carol f 22 120 64 6 Julie f 55 125 63 2 Joe m 34 130 68 7 Kelsey f 43 130 64 4 Ann f 29 . 65 11 Tracee f 21 110 . 9 Bob m 32 155 71 3 Ed m 40 120 69 8 Karl m 35 160 68 10 Gayla f 40 130 68 5 John m 17 175 73 run;
Sử dụng ‘var’
Bạn có thể thực hiện việc này bằng cách chỉ định các biến trong câu lệnh VAR trong bản in proc.
proc print data=one; var studyid age height; run;
Sử dụng ‘keep’
Một cách khác để làm điều này là sử dụng câu lệnh keep để tạo một tập dữ liệu mới chỉ với các biến đã chọn.
data two; set one; keep studyid age height; proc print; run;
Xem thêm Điều kiện WHERE trong SQL
Sử dụng ‘drop’
Tuy nhiên, một cách khác để làm điều này là sử dụng câu lệnh drop để loại bỏ các biến khác khỏi tập dữ liệu mới của bạn.
data three; set one; drop name sex weight; proc print; run;
Tất cả những thứ này sẽ tạo ra cùng một đầu ra:
Xem thêm SAS là gì? tìm hiểu về SAS
Quan sát thiết lập con SAS
Bạn có thể tạo tập dữ liệu mới chỉ với một tập hợp con của các quan sát trong tập dữ liệu ban đầu bằng cách sử dụng câu lệnh IF hoặc WHERE.
Để tạo tập dữ liệu mới chỉ bao gồm một tập hợp con các quan sát từ tập dữ liệu hiện có, hãy sử dụng câu lệnh SET cùng với câu lệnh IF tập hợp con.
Câu lệnh SET tạo ra một bản sao của bước dữ liệu gốc và câu lệnh IF chỉ chọn những quan sát đáp ứng yêu cầu của câu lệnh IF.
Câu lệnh WHERE có thể được sử dụng tương tự trong bước dữ liệu.
Sử dụng câu lệnh IF
Thí dụ:-
Có một tập dữ liệu tên là abc, giả sử đó là tập dữ liệu SAS với 76 trẻ em trai và 48 trẻ em gái.
Đầu tiên, chúng tôi sẽ chỉ chọn những cô gái, tức là những người có giới tính = 2
data abc; set pbkid; if sex=2; run; proc means data=abc; var iq; run;
Tiếp theo, chúng tôi sẽ chỉ chọn các bé trai, những người có giới tính = 1, sử dụng câu lệnh WHERE và đưa ra điểm IQ trung bình của chúng:
data abc; set pbkid; where sex=1; run; proc means data=abc; var iq; run;
Xem thêm Ứng dụng thực tế của SAS
Sử dụng câu lệnh WHERE
Trong ví dụ trên, để chỉ tạo thống kê trên một tập hợp con các quan sát của chúng tôi, chúng tôi đã tạo tập dữ liệu tập hợp con bằng cách sử dụng câu lệnh IF (hoặc WHERE) trong bước dữ liệu và sau đó áp dụng quy trình.
Tương tự, chúng ta có thể sử dụng câu lệnh where trực tiếp trong proc như được hiển thị bên dưới:
proc means data=abc; var iq; where sex = 1; title1 'MALE (1) IQ SCORES'; run; proc means data=abc; var iq; where sex=2; title1 'FEMALE (2) IQ SCORES'; run;
Kết luận trích xuất dữ liệu trong SAS
Chúng tôi đã học các tập dữ liệu con trong SAS, các câu lệnh có thể được sử dụng để trích xuất các biến quan tâm của chúng tôi và các câu lệnh có thể được sử dụng để trích xuất các quan sát mà chúng tôi quan tâm. Hy vọng bạn đã hiểu nó một cách rõ ràng.
Xem thêm Tìm hiểu về biến trong SAS