Rate this post

Chúng ta đã thảo luận về Tập dữ liệu SAS  trong hướng dẫn trước, bây giờ chúng ta sẽ thảo luận về Biến SAS, các thuộc tính của Biến SAS, các loại Biến SAS và cách chúng ta có thể tạo biến trong SAS. Biến mới dựa trên các biến khác. SAS tạo các biến ký tự mới và sử dụng chúng trong một chương trình.

Các bài viết liên quan:

Hơn nữa, chúng ta sẽ thấy một số ví dụ về Biến trong Ngôn ngữ lập trình SAS.

Vì vậy, hãy bắt đầu với Biến SAS.

Biến trong SAS là gì?

Biến SAS là tên do người dùng đặt cho bất kỳ cột nào của tập dữ liệu. Động cơ cơ bản đằng sau điều này là phân loại tất cả các quan sát theo một đặc điểm cụ thể như chiều cao, cân nặng, tên, ngày sinh, v.v.

Bất kỳ tên nào được đặt cho một biến tùy thuộc vào đặc tính, nó phải đại diện. Tuy nhiên, một số quy tắc cần được tuân thủ.

Bạn có thể tham khảo các quy tắc cần lưu ý khi đặt tên biến trong bài viết Cú pháp cơ bản của SAS.

Tạo biến SAS

Tại đây, chúng ta có thể tạo biến SAS theo hai cách:

Biến mới

Giả sử chúng ta có một tập dữ liệu được gọi là chiều dài có dữ liệu về chiều dài và chiều rộng.

Data length;
input length breadth;
cards;
65 130
70 150
67 145
72 180
62 110
;
run;

Đoạn mã trên sẽ tạo thành một tập dữ liệu với độ dài và độ rộng của các tên thay đổi và hiển thị 5 quan sát. Ở đây, một từ khóa đầu vào được sử dụng để xác định các biến và từ khóa thẻ để gán giá trị cho các biến.

Thêm biến vào tập dữ liệu hiện có

Chúng tôi muốn tạo một tập dữ liệu mới với một biến mới, Diện tích, dựa trên chiều dài và chiều rộng. Để tạo một biến mới, hãy chỉ định tên của biến trong bước DỮ LIỆU và đặt dấu (=) với các tham số mà nó phụ thuộc vào.

Ví dụ:

  • YearAge62 = byear+62;
  • income = salary + interest;
  • Parentsprice = (momsprice + dadsprice)/2;

Diện tích bằng chiều dài * chiều rộng.

Vì vậy, trong trường hợp này, nếu chúng ta có một tập dữ liệu chứa chiều dài tính bằng mét và chiều rộng tính bằng mét, chúng ta có thể sử dụng SAS để tính toán một biến dẫn xuất được gọi là “diện tích” dựa trên hai biến khác này. Đây là cách chúng tôi có thể làm điều này trong SAS:

data length;
input length breadth;
area = length*breadth;
cards;
65 130
70 150
67 145
72 180
62 110
;
run;

Tập dữ liệu “chiều dài” có ba biến, chiều dài, chiều rộng và diện tích. Lưu ý rằng câu lệnh tạo biến mới, khu vực, nằm giữa câu lệnh đầu vào và câu lệnh của thẻ. Các biến mới luôn được tạo trong một bước DATA.

Xem thêm Tập dữ liệu trong SAS – hướng dẫn cơ bản

Thuộc tính biến SAS

Các biến có 5 thuộc tính quan trọng, tên, kiểu, độ dài, định dạng và nhãn, giúp chúng ta xác định chúng và xác định cách chúng có thể được sử dụng.

Tên biến SAS

Khi đặt tên cho một biến, có một số quy tắc bạn phải tuân theo:

  1. Tên không được chứa nhiều hơn 32 ký tự.
  2. Tên không được bắt đầu bằng số mà phải bắt đầu bằng chữ cái (az) hoặc dấu gạch dưới (_). Các số có thể được sử dụng sau ký tự đầu tiên.
  3. Không được có Khoảng trống hoặc khoảng trống. Ví dụ: bạn không thể đặt tên cho một biến là “Họ” vì nó sẽ không nhận ra chỗ trống. Thay vào đó, hãy sử dụng “LastName” hoặc “last_name”.

Tránh đặt tên dài cho biến của bạn. Ngoài ra, hãy thử và tránh các tên biến chung chung như a1, a2, vì điều đó không cung cấp nhiều thông tin và có thể gây nhầm lẫn.

Loại biến SAS

Có hai loại biến SAS: số và ký tự.

  1. Biến số SAS

Số cửa hàng của Biến SAS này. Biến có thể được sử dụng để thực hiện các phép tính số học như cộng, trừ. Ngoài ra, các biến ngày-giờ cũng được coi là số trong SAS. Các giá trị bị thiếu cho các biến số xuất hiện dưới dạng dấu chấm (.).

Cú pháp:

INPUT VARIABLE1 VARIABLE2 ;
#Define numeric variables in the data set.

INPUT ID, SALARY, COMMISSION;

  1. Biến ký tự SAS

Biến SAS này còn được gọi là  biến chuỗi,  chứa thông tin mà hệ thống nhận dạng là văn bản. Các biến này trong SAS được xác định bằng cách đặt một ký hiệu đô la ($) ở cuối.

Chúng có thể bao gồm các chữ cái, các ký tự đặc biệt (chẳng hạn như &,%, (), $) và số chẵn. Các giá trị bị thiếu cho các biến ký tự xuất hiện dưới dạng khoảng trống (“”).

Cú pháp:

INPUT VAR1 $ VAR2 $ VAR3 $;  # Xác định các biến ký tự trong tập dữ liệu. 

Thí dụ:

INPUT $ LNAME $ ĐỊA CHỈ $;

  1. Độ dài biến SAS

“Độ dài” của một biến SAS tương ứng với số byte để lưu trữ các biến. Số byte mặc định cho cả biến số và ký tự là 8.

  1. Định dạng biến SAS

Định dạng của một biến hướng dẫn SAS cách nó phải in trong đầu ra SAS. Trong SAS, điều này bao gồm:

  1. Số vị trí thập phân để hiển thị cho các biến số (ví dụ: 1 so với 1,00)
  2. Định dạng ngày tháng (ví dụ: 16/05/2013 so với 2013MAY16 so với 2013-05-16)

Định dạng rất quan trọng để giúp người đọc hiểu dữ liệu của bạn và đầu ra của bạn. Các định dạng có thể thay đổi có đủ thông tin chi tiết mà chúng tôi đã chia chúng thành các hướng dẫn riêng.

  1. Nhãn biến SAS

Thêm nhãn vào biến SAS là một cách thú vị để làm cho tập dữ liệu trông dễ dàng hơn và diễn giải nó một cách dễ dàng. Nhãn cung cấp thêm thông tin. Ví dụ: hãy xem xét dữ liệu sinh viên trong đó chúng tôi đã lấy ngày sinh của sinh viên làm một biến và ngày nhập học của sinh viên làm biến thứ hai.

Bây giờ, giả sử chúng ta muốn tạo hai biến trong SAS, một cho độ tuổi hiện tại của chúng và một cho độ tuổi của chúng khi chúng bắt đầu học đại học, chúng ta sẽ đặt tên cho nó như “age_now” và “age_start”.

Tuy nhiên, nếu ai đó muốn xem dữ liệu của chúng tôi, anh ta sẽ nhầm lẫn giữa hai biến vì những tên biến như vậy có thể khó hiểu. Do đó, chúng tôi có thể muốn đặt tên chúng là “tuổi hiện tại của học sinh” và “tuổi của học sinh tại thời điểm bắt đầu vào đại học”.

SAS Các nhãn biến có thể gán trong một bước dữ liệu hoặc một bước proc. Khi một nhãn chỉ định trong một bước chiếu lệ, nó chỉ là tạm thời; nó sẽ chỉ liên kết với biến đó trong quá trình thực hiện bước proc mà nó chứa bên trong. (Nghĩa là, nhãn sẽ chỉ xuất hiện trong đầu ra của thủ tục mà nó bao gồm trong.) Khi một nhãn gán trong một bước dữ liệu, nó sẽ trở thành một phần vĩnh viễn của tập dữ liệu.

Một câu lệnh nhãn biến trông giống như sau:

LABEL variable_name = "Variable label";

Ví dụ về nhãn biến:

Hãy thêm nhãn vào biến bday trong tập dữ liệu mẫu của chúng tôi.

Nhãn biến SAS

Bây giờ, hãy tạm thời thêm nhãn vào biến “bday” trong bước proc. Chúng tôi sẽ chứng minh điều này bằng cách sử dụng câu lệnh PROC PRINT.

Điều quan trọng cần lưu ý là bạn có thể đặt một câu lệnh nhãn trong bước proc để gán nhãn cho biến mà bạn tạo ra trong bước proc. Điều này sẽ không thay đổi nhãn của biến trong tập dữ liệu.

PROC PRINT DATA=sample LABEL;   
          VAR bday;   
         LABEL bday = "Date of Birth";
RUN;

Lưu ý rằng trong đầu ra, tên biến trước đó là “bday” sẽ thay đổi thành “ngày sinh”. Điều này là tạm thời và do đó, tên biến sẽ không thay đổi trong tập dữ liệu.

Nhãn biến SAS

Bây giờ, nếu chúng ta muốn thêm vĩnh viễn một nhãn vào tập dữ liệu, chúng ta sẽ đặt nó trong một bước dữ liệu.

DATA students;   
            LABEL bday = "Date of Birth";
RUN;

Bản tóm tắt

Do đó, hôm nay chúng ta đã tìm hiểu biến SAS là gì, các loại biến trong SAS: Biến số, Biến ký tự SAS, Các thuộc tính khác nhau của biến trong lập trình SAS: Tên biến, độ dài, định dạng & nhãn của biến và cách chúng ta có thể tạo biến trong SAS.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now