Rate this post

clustering Density-based đề cập đến một phương pháp dựa trên tiêu chí cụm cục bộ, chẳng hạn như các điểm kết nối mật độ. Trong hướng dẫn này, chúng ta sẽ thảo luận về clustering Density-based với các ví dụ.

Các bài viết liên quan:

Clustering Density-based là gì?

clustering Density-based đề cập đến một trong những phương pháp học không giám sát phổ biến nhất được sử dụng trong các thuật toán xây dựng mô hình và học máy. Các điểm dữ liệu trong vùng cách nhau bởi hai cụm có mật độ điểm thấp được coi là nhiễu. Môi trường xung quanh có bán kính ε của một đối tượng nhất định được gọi là vùng lân cận ε của đối tượng. Nếu ε vùng lân cận của đối tượng bao gồm ít nhất một số tối thiểu, MinPts của các đối tượng, thì nó được gọi là đối tượng cốt lõi.

Clustering Density-based – background

Có hai tham số khác nhau để tính toán phân nhóm Density-based

EPS: Nó được coi là bán kính tối đa của vùng lân cận.

MinPts: MinPts đề cập đến số điểm tối thiểu trong một vùng lân cận Eps của điểm đó.

NEps (i): {k thuộc D và dist (i, k) <= Eps}

Có thể truy cập mật độ trực tiếp:

Điểm i được coi là mật độ trực tiếp có thể đạt được từ điểm k đối với Eps, MinPts nếu

tôi thuộc NEps (k)

Điều kiện cốt lõi:

NEps (k)> = MinPts

Density có thể đạt được:

Một điểm được ký hiệu là i là mật độ có thể đạt được từ điểm j đối với Eps, MinPts nếu có một chuỗi trình tự của điểm i1,…., In, i1 = j, pn = i sao cho ii + 1 là mật độ trực tiếp có thể truy cập từ ii.

Density connected:

Một điểm i đề cập đến mật độ kết nối với một điểm j đối với Eps, MinPts nếu có một điểm o sao cho cả i và j được coi là mật độ có thể đạt được từ o đối với Eps và MinPts.

Làm việc của clustering Density-based

Giả sử một tập hợp các đối tượng được ký hiệu là D ‘, chúng ta có thể nói rằng một đối tượng I có mật độ có thể tiếp cận trực tiếp là đối tượng j chỉ khi nó nằm trong vùng lân cận ε của j và j là một đối tượng cốt lõi.

Một đối tượng i có mật độ có thể truy cập được tạo thành đối tượng j liên quan đến ε và MinPts trong một tập hợp các đối tượng nhất định, D ‘chỉ khi có một chuỗi các chuỗi đối tượng điểm i1,…., In, i1 = j, pn = i như vậy rằng ii + 1 là mật độ có thể đạt được trực tiếp từ ii đối với ε và MinPts.

Một đối tượng i là đối tượng liên kết mật độ j với ε và MinPts trong một tập hợp các đối tượng nhất định, D ‘chỉ khi có một đối tượng o thuộc D sao cho cả điểm i và j đều có thể đạt được mật độ từ o đối với ε và MinPts.

Các tính năng chính của clustering Density-based

Các tính năng chính của clustering Density-based được đưa ra dưới đây.

  • Nó là một phương pháp quét.
  • Nó yêu cầu các tham số mật độ như một điều kiện kết thúc.
  • Nó được sử dụng để quản lý nhiễu trong các cụm dữ liệu.
  • clustering Density-based được sử dụng để xác định các cụm có kích thước tùy ý.

Phương pháp clustering Density-based

DBSCAN

DBSCAN là viết tắt của cụm từ clustering không gian Density-based của các ứng dụng có tiếng ồn. Nó phụ thuộc vào một khái niệm Density-based của cụm. Nó cũng xác định các cụm có kích thước tùy ý trong cơ sở dữ liệu không gian với các ngoại lệ.

OPTICS

OPTICS là viết tắt của cụm từ Điểm Thứ tự Để Xác định Cấu trúc clustering. Nó cung cấp một thứ tự đáng kể của cơ sở dữ liệu đối với cấu trúc clustering Density-based của nó. Thứ tự của cụm bao gồm thông tin tương đương với phân nhóm Density-based liên quan đến một loạt các cài đặt tham số. Các phương pháp OPTICS có lợi cho cả phân tích cụm tự động và tương tác, bao gồm cả việc xác định cấu trúc clustering nội tại.

DENCLUE

clustering Density-based của Hinnebirg và Kiem. Nó cho phép mô tả toán học nhỏ gọn về các cụm có hình dạng tùy ý ở trạng thái dữ liệu có kích thước cao và nó rất tốt cho các tập dữ liệu có lượng nhiễu lớn.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now