RStudio là một trong những IDE phổ biến nhất để làm việc với ngôn ngữ lập trình R. Ở đây trong hướng dẫn RStudio này, chúng tôi sẽ đề cập đến mọi khía cạnh của RStudio để bạn có thể hiểu thấu đáo về nó.
Các bài viết liên quan:
Trong hướng dẫn RStudio này, chúng ta sẽ thực hiện các thao tác sau:
- Tải xuống / Nhập dữ liệu trong R.
- Chuyển đổi dữ liệu và các hoạt động dữ liệu khác.
- Thực hiện mô hình thống kê trên dữ liệu.
- Tạo các lô dữ liệu đồ họa.
RStudio là gì?
RStudio là một môi trường phát triển tích hợp mã nguồn mở tạo điều kiện thuận lợi cho việc lập mô hình thống kê cũng như khả năng đồ họa cho R. Nó sử dụng khung QT cho các tính năng GUI của nó.
Có hai phiên bản RStudio – RStudio Desktop và RStudio Server.
Máy tính để bàn RStudio cung cấp các phương tiện để làm việc trên môi trường máy tính cục bộ, trong khi Máy chủ RStudio cung cấp quyền truy cập thông qua trình duyệt web.
Phân tích dữ liệu cơ bản thông qua RStudio
Chúng tôi sẽ thực hiện phân tích dữ liệu bằng RStudio trong phần này. Chúng tôi cũng sẽ thực hiện chuyển đổi dữ liệu cũng như vẽ biểu đồ của phân phối dữ liệu kết quả.
Làm thế nào để Nhập dữ liệu trong RStudio?
Để triển khai mô hình của chúng tôi trong RStudio, chúng tôi sẽ sử dụng bộ dữ liệu ACS (Khảo sát Cộng đồng Hoa Kỳ) . Chúng tôi có thể nhập dữ liệu này thông qua lệnh sau được nhập trong cửa sổ giao diện điều khiển.
> ACS_data <- read.csv(url(“http://stat511.cwick.co.nz/homeworks/acs_or.csv”))
Đầu ra:
Sau khi lệnh này được thực thi trong RStudio, toàn bộ tập dữ liệu ACS sẽ được tải vào đối tượng ACS_data dưới dạng tệp CSV.
Bạn có biết về Quy trình nhập dữ liệu trong R không? Nếu không, thì bạn chắc chắn nên tìm hiểu nó.
Làm thế nào để chuyển đổi dữ liệu thông qua RStudio?
Sau khi bạn đã nhập dữ liệu vào biến của mình trong RStudio , bây giờ bạn có thể áp dụng nhiều phép biến đổi khác nhau để thao tác dữ liệu. Một số kỹ thuật để truy cập dữ liệu như sau.
Để truy cập nhãn age_husband , chúng ta sử dụng lệnh sau:
> ACS_data$age_husband
Đầu ra:
Để truy cập dữ liệu dưới dạng vectơ, hãy sử dụng cái này:
> ACS_data [ 1 , 2 ]
Đầu ra:
Nếu bạn muốn truy xuất dữ liệu mà age_husband lớn hơn nhãn age_wife , thì chúng ta sẽ thực hiện lệnh sau:
> greater <- subset(ACS_data , age_husband > age_wife) > head(greater)
Đầu ra:
Trong đoạn mã trên, chúng tôi sử dụng hàm ‘tập hợp con’ và trong hàm này, chúng tôi chỉ định dữ liệu của mình mà hoạt động lớn hơn sẽ được áp dụng. Tham số thứ hai thực hiện điều kiện này. Cuối cùng, chúng tôi hiển thị 6 giá trị đầu tiên trả về giá trị mà age_husband lớn hơn age_wife .
Chúng ta có thể thực hiện các thao tác thống kê khác nhau như sau:
> mean(ACS_data$age_husband) #For calculating mean of column > median(ACS_data$age_husband) #For calculating median of column > quantile(ACS_data$age_wife) #For calculating the Quantile > var(ACS_data$age_wife) #For measuring the variance > sd(ACS_data$age_wife) #For calculating the Standard Deviance > #DataFlair
Đầu ra:
Để truy xuất bản tóm tắt của tập dữ liệu, chúng tôi sử dụng hàm tóm tắt () :
> summary(ACS_data) #Author websitehcm
Đầu ra:
Bạn có biết về các phép toán vectơ R không
Lập sơ đồ dữ liệu bằng RStudio
RStudio cung cấp các tính năng trực quan hóa đồ họa nâng cao. Chúng ta có thể vẽ biểu đồ dữ liệu ở trên với nhãn cột ‘age_husband’ trên trục x và cột age_wife trên trục y.
Biểu đồ phân tán được vẽ theo cách sau:
> sub <- ACS_data[1:100, ] #Author > plot(x = sub$age_husband , y = sub$age_wife, type = 'p')
Đầu ra:
Đầu tiên, chúng tôi tạo một tập hợp con được gọi là ‘con’ chỉ chứa 100 hàng. Chúng tôi sẽ vẽ biểu đồ các biến liên quan đến 100 hàng này.
Để mô tả một biểu đồ, chúng tôi sử dụng lệnh sau:
hist(ACS_data$number_children)
Đầu ra:
Chúng ta có thể tạo barplot như sau:
> get_table <- table(ACS_data$bedrooms) > barplot(get_table, main="Bedrooms Distribution", xlab="Bedroom Count")
Đầu ra:
Những câu hỏi phổ biến về RStudio
- RStudio là gì? RStudio là một môi trường phát triển tích hợp cho ngôn ngữ lập trình R. Nó cung cấp cho người dùng các công cụ để viết, chạy và gỡ lỗi mã R.
- Tại sao nên sử dụng RStudio? RStudio cung cấp cho người dùng một giao diện thân thiện, dễ sử dụng, hiệu quả và tích hợp nhiều công cụ hỗ trợ cho R. Nó giúp tăng năng suất và hiệu quả cho các nhà phân tích dữ liệu sử dụng R.
- RStudio có miễn phí hay không? RStudio cung cấp hai phiên bản: phiên bản miễn phí (RStudio Desktop) và phiên bản trả phí (RStudio Server Pro). Cả hai phiên bản đều có tính năng đầy đủ cho việc phát triển R.
- RStudio có hỗ trợ cho hệ điều hành nào? RStudio hỗ trợ cho Windows, macOS và Linux.
- Làm thế nào để cài đặt RStudio? Để cài đặt RStudio, trước tiên bạn cần phải cài đặt R. Sau đó, bạn có thể tải xuống phiên bản phù hợp của RStudio từ trang web của RStudio và cài đặt nó trên máy tính của mình.
- Làm thế nào để mở một tệp script trong RStudio? Để mở một tệp script trong RStudio, bạn có thể nhấp chuột trái vào biểu tượng “Open File” ở thanh công cụ hoặc sử dụng phím tắt “Ctrl+O”. Sau đó, bạn có thể chọn tệp script bạn muốn mở và nhấn nút “Open”.
- RStudio có tích hợp với Git không? Có, RStudio tích hợp với Git để quản lý phiên bản mã nguồn. Bạn có thể sử dụng tính năng này để theo dõi thay đổi trong mã nguồn và quản lý các nhánh khác nhau của mã nguồn.
- Làm thế nào để chạy một đoạn mã trong RStudio? Để chạy một đoạn mã trong RStudio, bạn có thể chọn đoạn mã đó và nhấn nút “Run” trên thanh công cụ hoặc sử dụng phím tắt “Ctrl+Enter”. Bạn cũng có thể chạy toàn bộ tệp script bằng cách nhấn nút “Source” trên thanh công cụ.
- Làm thế nào để tạo một biến trong RStudio? Để tạo một biến trong RStudio, bạn có thể sử dụng toán tử gán “=” hoặc “<-” để gán giá trị cho biến. Ví dụ, nếu bạn muốn tạo một biến có tên là “x” và gán giá trị là 5, bạn có thể sử dụng mã sau:
x = 5
hoặc
x <- 5
Sau đó, bạn có thể sử dụng biến “x” trong các phép tính hoặc lệnh khác trong tệp script của bạn.
- RStudio có tích hợp với các gói (packages) của R không? Có, RStudio có tích hợp với hệ thống quản lý gói của R để cho phép người dùng tải xuống và cài đặt các gói R. Bạn có thể sử dụng tính năng này để quản lý các gói của bạn và cập nhật chúng khi cần thiết. Bạn cũng có thể sử dụng RStudio để tạo và quản lý gói của riêng mình.
Bản tóm tắt
Trong hướng dẫn RStudio này, chúng ta đã tìm hiểu những kiến thức cơ bản về RStudio. Chúng tôi suy ra cách nhập dữ liệu, chuyển đổi dữ liệu, thực hiện phân tích trên dữ liệu và cuối cùng, trực quan hóa dữ liệu. Chúng tôi hy vọng rằng bạn đã hiểu tất cả các quy trình của RStudio với bài viết này.