Chúng ta sẽ nghiên cứu cú pháp SAS và các khái niệm liên quan đến cú pháp của ngôn ngữ lập trình SAS. Bất cứ khi nào chúng ta viết một chương trình, điều quan trọng là phải ghi nhớ cú pháp và bộ quy tắc mà chương trình đó phải tuân theo.
Giống như tất cả các ngôn ngữ, ngôn ngữ lập trình SAS cũng tuân theo một tập hợp các quy tắc trong khi tạo một chương trình, được gọi là Cú pháp SAS. Chúng tôi sẽ nghiên cứu chi tiết các quy ước khác nhau của cú pháp SAS.
Các bài viết liên quan:
Hãy nhanh chóng bắt đầu hướng dẫn cú pháp SAS.
Câu lệnh cú pháp SAS
Dưới đây là các điều kiện để thực hiện các câu lệnh cú pháp SAS:
- Các câu lệnh trong SAS có thể bắt đầu ở bất kỳ đâu và có thể kết thúc ở bất kỳ đâu.
- Mọi câu lệnh phải kết thúc bằng dấu chấm phẩy.
- SAS cho phép các câu lệnh nằm trên cùng một dòng hoặc nhiều dòng, với mỗi câu lệnh kết thúc bằng dấu chấm phẩy.
- Các thành phần trong câu lệnh của chương trình SAS có thể được phân tách bằng dấu cách.
- Các từ khóa SAS không phân biệt chữ hoa chữ thường nhưng sẽ rất tuyệt nếu sử dụng các chữ hoa để chương trình trông gọn gàng, có tổ chức và dễ hiểu hơn.
- Mọi chương trình SAS phải kết thúc bằng câu lệnh RUN.
- Các câu lệnh SAS có thể viết hoa hoặc viết thường.
- Các câu lệnh có thể bắt đầu trong bất kỳ cột nào.
Cú pháp SAS cơ bản-Quy tắc:
Các câu lệnh SAS có những đặc điểm sau:
- Thông thường, hãy bắt đầu với một từ khóa xác định.
- Luôn kết thúc bằng dấu chấm phẩy
data staff; input LastName $ FirstName $ JobTitle $ Salary; datalines; ...insert text here... run; proc print data=staff; run;
Dấu ngoặc kép
Lập trình SAS có khả năng nhận dạng văn bản khi ở trong dấu ngoặc kép (“ xyz”) hoặc dấu nháy đơn (‘ xyz’). Có thể sử dụng cả hai, nhưng hãy đảm bảo rằng khối văn bản phải bắt đầu và kết thúc bằng cùng một khối.
Khi SAS thay đổi màu sắc của các từ thành màu hồng tía, bạn sẽ biết rằng bạn đã tuân thủ các quy tắc một cách chính xác. Điều quan trọng cần lưu ý là nếu văn bản của bạn có dấu nháy đơn, thì bạn phải đặt nó bằng dấu ngoặc kép. Kiểm tra một minh họa tương tự:
“Đây là một câu” -> Sử dụng đúng hai dấu ngoặc kép.
‘Đây là một câu’ -> Sử dụng đúng hai dấu lược.
‘Đây là một câu’ -> Sử dụng sai hai dấu nháy đơn vì có một dấu nháy đơn trong văn bản.
“Đây là một câu” -> Sử dụng đúng hai dấu ngoặc kép khi văn bản có dấu nháy đơn.
Xem thêm Cú pháp Swift
Định dạng trong SAS
Ngôn ngữ lập trình SAS không nghiêm ngặt so với các ngôn ngữ mã hóa khác về việc sử dụng cách viết hoa, thụt lề và ngắt dòng.
- Bất kỳ dấu thụt lề hoặc khoảng cách nào trước một câu lệnh đều bị bỏ qua.
- Bất kỳ dòng thừa nào xảy ra giữa các câu lệnh đều bị bỏ qua.
Tên biến SAS
Bây giờ, trong hướng dẫn Cú pháp SAS, chúng ta sẽ khám phá tên biến trong ngôn ngữ Lập trình SAS.
Tên biến SAS là tên được đặt cho một cột của tập dữ liệu SAS. Các quy tắc sau phải được tuân thủ khi đặt tên biến trong SAS:
- Nó có thể có độ dài tối đa là 32 ký tự.
- Không có khoảng trống nào nên được đưa vào.
- Nó phải bắt đầu bằng dấu gạch dưới (_) hoặc bất kỳ chữ cái nào từ A đến Z (không quan trọng là chữ cái viết hoa hay viết thường).
- Có thể bao gồm số nhưng ký tự đầu tiên không được là số.
- Tên biến không phân biệt chữ hoa chữ thường.
Điều cuối cùng là một điểm quan trọng trong Cú pháp SAS cho một tên biến. Ví dụ- Độ dài-độ rộng của tên tập dữ liệu giống với độ dài LENGTHBREADTH hoặc Độ dài chiều dài.
Thí dụ:
# MỘT SỐ Tên biến Hợp lệ
- EMPLOYEE_NAME
- EMPLOYEE
- _ADDRESS
# Tên biến không hợp lệ
- NGÀY THAM GIA #contains Space.
- PERCENTAGE% # chứa một ký tự đặc biệt không phải là dấu gạch dưới.
- 82_ID # Bắt đầu bằng một số.
Tập dữ liệu SAS
Trong phần này của Cú pháp SAS, chúng ta sẽ tìm hiểu DataSet. Câu lệnh DATA chỉ ra rằng một tập dữ liệu mới được tạo trong SAS. Các quy tắc để tạo tập DATA như sau:
- Khi một câu lệnh DATA theo sau bởi một từ, điều đó có nghĩa là một tập dữ liệu tạm thời được tạo và sẽ bị xóa khi phiên kết thúc.
- Để một tập dữ liệu là vĩnh viễn, chúng ta phải đặt trước nó bằng tên thư viện để nó trở thành vĩnh viễn. Sau khi vĩnh viễn, tập dữ liệu vẫn còn ngay cả sau khi phiên kết thúc.
- Nếu tên tập dữ liệu SAS bị bỏ qua, thì SAS sẽ tạo một tập dữ liệu tạm thời với tên mà SAS tạo ra như – DATA1, DATA2, v.v.
Thí dụ:
# Bộ dữ liệu tạm thời.
- DATA Temp_Data;
- DATA abc;
# Tập hợp dữ liệu vĩnh viễn.
- DATA LIBRARY1.
- DATA1DATA MYLIB.newdat;
Đôi khi, dữ liệu của chúng tôi vẫn chưa hoàn thiện và SAS không thể hiểu được. Trong những trường hợp như vậy, nếu thiếu dữ liệu ký tự, thì dữ liệu đó biểu thị bằng một khoảng trống và một dấu chấm (.) Biểu thị dữ liệu số bị thiếu.
Xem thêm Function SAS – Tìm hiểu 4 loại hàm chính với các ví dụ
Phần mở rộng tệp SAS
Windows lưu các chương trình SAS, các tệp dữ liệu với các phần mở rộng khác nhau, một số là:
- * .log – Nó đại diện cho Tệp nhật ký SAS. Nó chứa tất cả thông tin về lỗi, cảnh báo và tập dữ liệu khi chương trình được chạy và tương tự như lịch sử duyệt web trên máy tính của chúng tôi.
- * .sas – Nó đại diện cho tệp mã SAS có thể chỉnh sửa bằng Trình soạn thảo SAS hoặc bất kỳ trình soạn thảo văn bản nào.
- * .mht / * .html – Nó lưu trữ tất cả các kết quả của một chương trình SAS.
- * .sas7bdat – Nó đại diện cho toàn bộ tập dữ liệu SAS.
Xem thêm Sử dụng Date và time trong SAS
Comment của SAS
Nhận xét SAS là bất kỳ dòng hoặc một khối mã nào mà SAS bỏ qua trong quá trình thực thi một chương trình. Nhận xét cải thiện khả năng đọc của một chương trình bằng cách biểu thị các bước đang thực hiện, những gì cần thực hiện hoặc cách một cái gì đó đang hoạt động.
Một chương trình có nhận xét tốt sẽ giúp người dùng hiểu được quá trình suy nghĩ trong khi thực hiện chương trình.
Có hai cách mà chúng ta có thể nhận xét trong một chương trình SAS:
- Thêm dấu hoa thị ở đầu dòng và thêm dấu chấm phẩy ở cuối văn bản mà chúng tôi muốn xuất hiện dưới dạng nhận xét. Tất cả văn bản giữa dấu hoa thị và dấu chấm phẩy sẽ bị SAS bỏ qua trong quá trình thực thi.
- Thêm dấu gạch chéo lên và dấu hoa thị ở đầu nhận xét, đồng thời đặt dấu hoa thị và dấu gạch chéo lên ở cuối dòng.
Một chương trình SAS mẫu có chứa các chú thích có thể trông như thế này:
procedure; PROC CONTENTS; RUN; /* Print the contents of the most recently used dataset using the PRINT procedure.*/ PROC PRINT; RUN;
Sau đây là một ví dụ về nhận xét nhiều dòng:
* Đây là dòng đầu tiên của nhận xét
* Đây là dòng thứ hai của nhận xét;
/ * Đây là nhận xét * /
Sau đây là một ví dụ về nhận xét nhiều dòng:
/ * Đây là dòng đầu tiên của nhận xét
* Đây là dòng thứ hai của nhận xét * /
Vì vậy, đây là tất cả về Cú pháp SAS. Hy vọng bạn thích giải thích của chúng tôi.
Xem thêm Tập dữ liệu trong SAS – hướng dẫn cơ bản
Phân tích dữ liệu với SAS
SAS cung cấp một loạt các công cụ và thuật toán phân tích dữ liệu mạnh mẽ để khám phá, xử lý và trực quan hóa dữ liệu từ nhiều nguồn khác nhau. Dưới đây là một số phương pháp phân tích dữ liệu thông qua SAS:
Sử dụng SAS để thống kê và khám phá dữ liệu
SAS cung cấp các thủ tục và phương pháp thống kê để phân tích và khám phá dữ liệu. Bằng cách sử dụng các thủ tục như PROC MEANS, PROC FREQ và PROC UNIVARIATE, bạn có thể tính toán các thống kê mô tả, tần số, phân phối và các chỉ số khác để hiểu dữ liệu của mình. Ngoài ra, SAS cũng hỗ trợ các thủ tục phân tích khác như phân tích hồi quy (PROC REG), phân tích phân nhóm (PROC ANOVA) và phân tích chuỗi thời gian (PROC TIMESERIES) để xác định mối quan hệ và xu hướng trong dữ liệu.
Xây dựng mô hình dự đoán và phân loại trong SAS
SAS cung cấp các thuật toán học máy và khai phá dữ liệu để xây dựng mô hình dự đoán và phân loại. Bạn có thể sử dụng các thủ tục như PROC LOGISTIC, PROC GENMOD, PROC HPFOREST và PROC HPNEURAL để xác định mô hình hồi quy logistic, hồi quy tổng quát, học máy cây quyết định và mạng nơ-ron. SAS cũng hỗ trợ các phương pháp thống kê khác như k-means clustering (PROC FASTCLUS) và phân tích thành phần chính (PROC FACTOR) để phân nhóm và giảm chiều dữ liệu.
Bên cạnh đó, SAS cũng cung cấp các giao diện và tích hợp với các công cụ phân tích và trực quan hóa dữ liệu khác như SAS Enterprise Miner, SAS Visual Analytics và SAS Visual Statistics để tối ưu hóa quy trình phân tích và khám phá dữ liệu của bạn.
Tổng kết, SAS là một công cụ mạnh mẽ để phân tích dữ liệu từ các nguồn khác nhau và cung cấp các phương pháp và thuật toán phân tích đa dạng để hiểu và tìm ra thông tin quan trọng từ dữ liệu.
Tối ưu hóa và tùy chỉnh trong SAS
Trong SAS, bạn có thể tối ưu hóa và tùy chỉnh quy trình phân tích dữ liệu để đạt được hiệu suất cao và đáp ứng nhu cầu cụ thể của dự án. Dưới đây là một số cách tối ưu hóa và tùy chỉnh trong SAS:
Sử dụng SAS Macro và Macro Variable
SAS Macro là một tính năng mạnh mẽ trong SAS cho phép bạn tạo ra các tập lệnh động và tái sử dụng. Bằng cách sử dụng Macro, bạn có thể tạo ra các đoạn mã chương trình linh hoạt và tùy chỉnh để thực hiện các tác vụ lặp lại hoặc xử lý dữ liệu khác nhau mà không cần viết lại mã chương trình. Bạn cũng có thể sử dụng Macro Variable để lưu trữ và sử dụng các giá trị dữ liệu động trong quy trình phân tích.
Xem thêm Sử dụng hồi quy tuyến tính trong SAS
Tối ưu hóa hiệu suất trong SAS
Để tối ưu hóa hiệu suất trong SAS, bạn có thể áp dụng các kỹ thuật sau:
- Sử dụng câu lệnh SET thay vì MERGE để kết hợp các tập dữ liệu khi có cùng cấu trúc.
- Sử dụng các thủ tục SAS tích hợp như PROC SORT để sắp xếp dữ liệu trước khi thực hiện các phân tích.
- Sử dụng INDEX và WHERE trong câu lệnh DATA để tạo chỉ mục và lọc dữ liệu.
- Sử dụng FORMAT và INFORMAT để chuyển đổi dữ liệu và giảm thiểu việc đọc/ghi dữ liệu từ nguồn bên ngoài.
- Sử dụng kiến thức về kích thước bộ nhớ và lựa chọn các thuật toán phù hợp trong các phân tích dữ liệu lớn (big data).
Tùy chỉnh trong SAS
SAS cung cấp các tính năng tùy chỉnh để bạn có thể đáp ứng các yêu cầu cụ thể của dự án hoặc tăng tính linh hoạt trong quy trình phân tích. Bạn có thể sử dụng các ngôn ngữ lập trình khác nhau như SAS Macro, SQL và Python để mở rộng và tùy chỉnh tính năng của SAS. Bên cạnh đó, SAS cũng hỗ trợ giao diện API và tích hợp với các công cụ và thư viện bên ngoài như R và MATLAB để tận dụng các công cụ mạnh mẽ khác trong quy trình phân tích của bạn.
Tổng kết, SAS cung cấp các công cụ và khả năng tùy chỉnh để bạn có thể tối ưu hóa và tùy chỉnh quy trình phân tích dữ liệu, đảm bảo hiệu suất cao và đáp ứng nhu cầu cụ thể của dự án của bạn.
Bản tóm tắt
Chúng tôi đã nghiên cứu tất cả các Quy tắc cú pháp SAS cơ bản, cũng như cú pháp SAS cho các loại câu lệnh khác nhau. Bạn phải tuân theo tất cả các điều kiện khi viết một chương trình trong SAS với Cú pháp SAS.
Phần quan trọng nhất là hãy nhớ rằng tất cả các câu lệnh trong SAS đều kết thúc bằng dấu chấm phẩy và SAS không phải là ngôn ngữ phân biệt chữ hoa chữ thường.
Xem thêm SAS là gì? tìm hiểu về SAS