Trong Hướng dẫn SAS này , chúng ta sẽ thảo luận về Tập dữ liệu SAS. Dữ liệu là khối xây dựng và là thành phần chính của bất kỳ tập dữ liệu nào. Chúng ta cũng sẽ tìm hiểu về các phần của Tập dữ liệu SAS: Phần mô tả và Phần dữ liệu, Tập dữ liệu SAS đặc biệt và Tập dữ liệu tích hợp.
Đồng thời, chúng ta sẽ thảo luận một số ví dụ về Tập dữ liệu để khám phá định nghĩa của Tập dữ liệu trong Lập trình SAS.
Tập dữ liệu SAS là gì?
Tập dữ liệu SAS về cơ bản là một tệp SAS được lưu trữ trong thư viện SAS, được tạo và xử lý bởi SAS. Tập dữ liệu chứa các giá trị dữ liệu sắp xếp ở dạng hàng và cột bên trong bảng. Trong thuật ngữ SAS, hàng được gọi là quan sát và cột được gọi là biến SAS.
Đây là tập dữ liệu trong SAS trông giống như
Biến (còn gọi là cột)
Quan sát (còn được gọi là hàng)
Mỗi dòng đại diện cho một quan sát, trong khi id, bday, Giới tính, Xếp hạng và Trạng thái là các biến. Điểm dữ liệu 10NOV1994 là một trong những giá trị của biến bday và cũng là một phần của quan sát thứ sáu.
Các phần của Tập dữ liệu SAS
Có hai loại Tập dữ liệu SAS: Phần mô tả và Phần dữ liệu.
Phần mô tả
Phần bộ mô tả của tập dữ liệu SAS chứa thông tin quan trọng của tập dữ liệu, chẳng hạn như tên của tập dữ liệu, ngày và giờ tại đó tập dữ liệu được tạo. Ngày và giờ nó được sửa đổi lần cuối, số lượng quan sát trong tập dữ liệu và số lượng biến.
Bảng sau là minh họa phần mô tả của Tập dữ liệu SAS với tên work.grade .
Phần dữ liệu
Phần dữ liệu về cơ bản bao gồm tất cả các giá trị dữ liệu của tập dữ liệu SAS. Các giá trị dữ liệu được tổ chức dưới dạng một bảng. Dưới đây là một hình ảnh minh họa tương tự.
TÔI | Tên | Chiều cao | Trọng lượng |
53 | Susie | 65 | 120 |
54 | Charles | 72 | 200 |
55 | Linda | 60 | 105 |
56 | Lucy | 63 | 142 |
57 | Dennis | 70 | 166 |
Trong ví dụ về Tập dữ liệu SAS này, số 57 là giá trị dữ liệu, tên Linda là giá trị dữ liệu, trọng số 105 là giá trị dữ liệu, v.v.
Các biến (cột) chứa các giá trị dữ liệu mô tả một đặc điểm cụ thể của đối tượng được đo lường, chẳng hạn như trọng lượng trong bảng trên. Dữ liệu SAS có khả năng lưu trữ hàng nghìn biến.
Tập dữ liệu SAS có bốn biến – id , tên , chiều cao và cân nặng . Các quan sát (hoặc hàng) là tập hợp các giá trị dữ liệu tham chiếu đến một đối tượng cụ thể (chẳng hạn như một người tên là Linda ).
Các giá trị 55, Linda, 60 ″ và 105 tạo thành một quan sát duy nhất trong tập dữ liệu trên. Dữ liệu SAS có khả năng lưu trữ bất kỳ số lượng quan sát nào giống như các biến. Tập dữ liệu SAS ở trên chứa năm quan sát.
Tập dữ liệu SAS đặc biệt
Có ba loại Tập dữ liệu SAS đặc biệt:
Tập dữ liệu NULL
Đôi khi, có thể xảy ra trường hợp chúng tôi muốn thực hiện một bước DATA, nhưng chúng tôi không muốn tạo tập dữ liệu, trong những trường hợp như vậy _NULL_ có thể sử dụng. Câu lệnh sau đây bắt đầu bước DATA mà không có tập dữ liệu nào tạo:
data _null_;
Tập dữ liệu mặc định
SAS đủ rõ ràng để nhớ tập dữ liệu cuối cùng sử dụng bằng cách sử dụng từ dự trữ _LAST_. Nếu chúng tôi thực thi một bước DATA hoặc một PROC mà không đề cập đến tập dữ liệu, thì SAS theo mặc định sẽ sử dụng tập dữ liệu _LAST_.
Quy ước đặt tên tự động
Nếu bạn không đặt tên cho tập dữ liệu SAS hoặc tên dành riêng _NULL_ trong câu lệnh DATA, SAS sẽ tự động tạo tập dữ liệu có tên DATA1, DATA2, v.v. để được lưu trữ trong thư viện.
Tính năng này được gọi là quy ước đặt tên DATA. Dưới đây là một ví dụ về một câu lệnh mà tập dữ liệu SAS tạo ra bằng cách sử dụng quy ước đặt tên dữ liệu:
Dữ liệu ;
Tập dữ liệu tích hợp SAS
Phần mềm SAS có một số bộ dữ liệu đã có sẵn trong thư viện SAS và có thể sử dụng để chạy các chương trình mẫu, thực hiện phân tích và tính toán. Tất cả các tập dữ liệu lưu trữ dưới SASHELP trong thư viện của tôi.
Bây giờ, chúng ta hãy nói rằng chúng ta muốn sử dụng tập dữ liệu có tên CARS, nhấp đúp vào nó và một ngăn sẽ mở ra ở bên phải. Hình ảnh bên dưới cho thấy tập dữ liệu CARS là tập dữ liệu có sẵn trong thư viện SAS.
Toàn bộ cột và giá trị dữ liệu có thể nhìn thấy khi cuộn qua tập dữ liệu.
Bản tóm tắt
Chúng tôi đã nghiên cứu rằng Tập dữ liệu SAS là một phần không thể thiếu trong khi phát triển bất kỳ chương trình nào trong SAS. Tính năng quan trọng nhất là nó cho phép nhiều biến và hàng nghìn quan sát được tổ chức bên trong một bảng. SAS cũng có tính năng sử dụng tập dữ liệu mặc định và rỗng khi không có tập dữ liệu nào được chỉ định.