Rate this post

Trong hướng dẫn này, chúng ta sẽ tìm hiểu về các hàm dựng sẵn trong R, trong đó chúng ta sẽ tập trung vào các loại hàm số và ký tự khác nhau trong R. Cùng với đó, chúng ta cũng sẽ hiểu các loại thuộc tính khác nhau của hàm ký tự.

Vì vậy, chúng ta hãy bắt đầu hướng dẫn hàm số và ký tự R. R Các chức năng tích hợp.

Chúng tôi sử dụng các hàm dựng sẵn của R để thực hiện hầu hết mọi thứ trong R. Ở đây chúng tôi chỉ đề cập đến các hàm số và ký tự thường được sử dụng trong việc tạo hoặc ghi lại các biến.

Các bài viết liên quan:

R Các hàm số

Hãy để chúng tôi xem R Các hàm số

Mô tả chức năng

  • abs(x) giá trị tuyệt đối
  • ceiling(x) trần (3.475) là 4
  • sqrt (x) căn bậc hai
  • floor(x) tầng (3,475) là 3
  • log (x) logarit tự nhiên
  • trunc (x) trunc (5,99) là 5
  • round(x, digits=n) round(3,475, chữ số = 2) là 3,48
  • log10 (x) logarit chung
  • signif (x, chữ số = n) signif (3,475, chữ số = 2) là 3,5
  • exp (x) e ^ x
  • cos (x), sin (x), tan (x) cũng như acos (x), cosh (x), acosh (zx), v.v.

Các hàm ký tự trong R

Hãy để chúng tôi xem các chức năng ký tự R khác nhau:

1. grep(pattern, x , ignore.case=FALSE, fixed=FALSE)

Mô tả:

  1. Tìm kiếm một mẫu trong x.
  2. Nếu Fixed = FALSE, thì mẫu là một biểu thức chính quy.
  3. Nếu Fixed = TRUE, thì mẫu là một chuỗi văn bản.
  4. Trả về các chỉ số phù hợp.
grep("A", c("b", "A", "c"), fixed = TRUE)

Đầu ra:

2. substr (x, start = n1, stop = n2)

Mô tả:

  • Trích xuất hoặc thay thế các chuỗi con trong một vectơ ký tự.
> string = "abcdef"
> substr(string,2,4)

> substr(string,2,4) <- "2222"
> string

Đầu ra:

3. strsplit

strsplit("abc", "")

Đầu ra:

4. sub(pattern, replacement, x, ignore.case =FALSE, fixed=FALSE)

Mô tả:

  1. Tìm một mẫu trong x và thay thế nó bằng văn bản thay thế.
  2. Nếu fixed = FALSE, thì một mẫu là một biểu thức chính quy.
  3. Nếu fixed = TRUE, thì một mẫu là một chuỗi văn bản.

Đầu ra:

5. toupper (chuỗi)

Mô tả: Chữ hoa

toupper(string)

6. tolower (chuỗi)

Mô tả: Chữ thường

tolower(string)

Đầu ra:

7. paste(…, sep=””)

Mô tả: Nối các chuỗi sau khi sử dụng chuỗi sep để tách chúng.

> paste("string", 1:3, sep = "")

> paste("string", 1:3, sep = "M")

> paste("Today is", date())

Đầu ra:

Chức năng ký tự R – Tạo chuỗi

Trong R, chúng tôi lưu trữ các chuỗi trong một vectơ ký tự. Chúng ta có thể tạo chuỗi với một dấu nháy đơn / nháy kép.

Chuyển đổi đối tượng thành loại ký tự

Chúng tôi sử dụng một hàm as.character để chuyển đổi các đối số thành một kiểu ký tự.

Ví dụ – Chúng tôi đang lưu trữ 20 dưới dạng một ký tự.

Y = as.character(20)

class(Y)

Class(Y) trả về ký tự là 20 và được lưu trữ dưới dạng ký tự trong đoạn mã trên.

Kiểm tra kiểu ký tự

X = "Hadoop at websitehcm"
is.character(X)

Có các hàm khác tương tự như is.character như is.integer, is.array và is.character để xác thực các kiểu dữ liệu số nguyên, mảng và ký tự tương ứng.

Nối chuỗi trong R

Để nối hai chuỗi (còn được gọi là nối), chúng ta sử dụng hàm dán. Nó là một trong những tác vụ thao tác chuỗi quan trọng nhất. Mọi nhà phân tích thực hiện nó gần như hàng ngày để cấu trúc dữ liệu.

Cú pháp hàm dán:

paste (objects, sep = " ", collapse = NULL)

  • sep – Từ khóa biểu thị dấu phân tách hoặc dấu phân cách.
  • dấu phân cách mặc định – Một khoảng trắng duy nhất.
  • collapse – Từ khóa được sử dụng để tách các kết quả.

Ví dụ :

> x = "DataFlair"
> y = "Big Data"
> paste(x,y)

Đầu ra:

Định dạng chuỗi trong R

Giả sử giá trị được lưu trữ dưới dạng phân số và bạn cần chuyển nó thành phần trăm. Để định dạng chuỗi của chúng tôi theo kiểu C, hàm sprintf được sử dụng.

Cú pháp hàm Sprintf:

sprintf(fmt, ...)

Từ khóa fmt biểu thị định dạng chuỗi. Các số và chữ cái trong định dạng bắt đầu bằng ký hiệu%.

x = 0.25
sprintf("%.2f%%",x*100)

Đầu ra:

Trích xuất hoặc thay thế các chuỗi con trong R

Cú pháp substr –

> name = "abcdef"
> substr(name,1,4)

Trong ví dụ trên, chúng tôi yêu cầu R thay thế 3 bản tin đầu tiên bằng 111.

Thay thế chuỗi con – substr (x, vị trí bắt đầu, vị trí kết thúc) = Giá trị

> substr(name,1,3) = "11" #Replacing Substring 
> name

Đầu ra:

Chiều dài chuỗi

Hàm nchar được sử dụng để tính độ dài của một giá trị ký tự.

> x = "Big Data at DataFlair"
> nchar(x)

Đầu ra:

Nó trả về 14 vì vectơ ‘x’ chứa 14 chữ cái (bao gồm 2 khoảng trắng).

Trích xuất từ ​​từ một chương trình

Giả sử bạn cần kéo một từ đầu tiên hoặc cuối cùng từ một chuỗi ký tự.

Cú pháp hàm Word (Thư viện: stringr)

word(string, position of word to extract, separator)

Ví dụ :

> name = "Big Data DataFlair"
> library(stringr)
> word(name,1)

Trong ví dụ trên, ‘1’ biểu thị từ đầu tiên được trích xuất từ ​​một chuỗi.

Trích xuất từ ​​cuối cùng

> word(name,-1) #Extracting Last Word

Trong ví dụ trên, ‘-1’ biểu thị từ đầu tiên được trích xuất từ ​​bên phải của chuỗi.

Đầu ra:

Chuyển ký tự thành chữ hoa / chữ thường / chữ viết hoa

Đôi khi, chúng ta cần thay đổi trường hợp của một từ.

Ví dụ : chuyển đổi trường hợp thành chữ hoa hoặc chữ thường.

> name = "Big Data DataFlair"
> tolower(name) #lowercase

Hàm tolower () chuyển đổi các chữ cái trong một chuỗi thành chữ thường.

toupper (x)

> toupper(name) #UPPERCASE

Hàm toupper () chuyển đổi các chữ cái trong một chuỗi thành chữ hoa.

thư viện (stringr)

> library(stringr)
> str_to_title(name) #Title Case

Hàm str_to_title () chuyển đổi chữ cái đầu tiên trong một chuỗi thành chữ hoa và các chữ cái còn lại thành chữ thường.

Đầu ra:

Lặp lại ký tự N lần

Chúng ta có thể sử dụng hàm strrep cơ sở R để lặp lại ký tự N lần.

> strrep("websitehcm", 5)

Tìm chuỗi trong một biến ký tự

Hàm str_detect () giúp kiểm tra xem một chuỗi con có tồn tại trong một chuỗi hay không. Nó bằng với hàm ‘chứa’ của SAS. Nó trả về TRUE / FALSE đối với mỗi giá trị.

> names = c("DataFlair", "Hadoop", "Spark", "Flink")
> library(stringr)
> str_detect(names, "DataFlair")

Đầu ra:

Tách một vectơ ký tự

Trong trường hợp khai thác văn bản, cần phải tách một chuỗi để tính toán các từ khóa được sử dụng trong danh sách. Chúng tôi sử dụng ‘strsplit ()’ trong cơ sở R để thực hiện thao tác này.

> sentence <- "Big Data at DataFlair"
> strsplit(sentence, "")

Đầu ra:

Bản tóm tắt

Chúng tôi đã nghiên cứu sâu về các hàm số và ký tự khác nhau trong R, đồng thời cũng tìm hiểu các thuộc tính khác nhau của các hàm này giúp ích rất nhiều trong lập trình R.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now