Rate this post

Một hạn chế của các kỹ thuật trực quan hóa hướng pixel là chúng không thể giúp chúng ta nhiều trong việc hiểu sự phân bố dữ liệu trong không gian đa chiều. Ví dụ, chúng không hiển thị liệu có một khu vực dày đặc trong một không gian con đa chiều hay không. Kỹ thuật chiếu hình học giúp người dùng tìm thấy các phép chiếu thú vị của các tập dữ liệu đa chiều. Thách thức chính mà các kỹ thuật chiếu hình học cố gắng giải quyết là làm thế nào để hình dung một không gian chiều cao trên màn hình 2-D.

Các bài viết liên quan:

Hình ảnh hóa tập dữ liệu 2-D bằng cách sử dụng biểu đồ phân tán.

Biểu đồ phân tán hiển thị các điểm dữ liệu 2-D sử dụng tọa độ Descartes. Kích thước thứ ba có thể được thêm vào bằng cách sử dụng các màu sắc hoặc hình dạng khác nhau để đại diện cho các điểm dữ liệu khác nhau. Hình 9 cho thấy một ví dụ, trong đó X và Y là hai thuộc tính không gian và chiều thứ ba được biểu diễn bằng các hình dạng khác nhau. Thông qua hình dung này, chúng ta có thể thấy rằng các điểm của kiểu “+” và “X” có xu hướng được sắp xếp theo màu.

Biểu đồ phân tán 3-D sử dụng ba trục trong hệ tọa độ Descartes. Nếu nó cũng sử dụng màu, nó có thể hiển thị lên đến điểm dữ liệu 4-D.

Đối với các tập dữ liệu có nhiều hơn bốn chiều, các biểu đồ phân tán thường không hiệu quả. Kỹ thuật ma trận biểu đồ phân tán là một phần mở rộng hữu ích cho biểu đồ phân tán. Đối với tập dữ liệu thời gian, ma trận biểu đồ phân tán là một lưới n × n gồm các biểu đồ phân tán 2-D cung cấp hình ảnh trực quan về từng thứ nguyên với mọi thứ nguyên khác.

Ma trận biểu đồ phân tán trở nên kém hiệu quả hơn khi số chiều tăng lên. Một kỹ thuật phổ biến khác, được gọi là tọa độ song song, có thể xử lý số chiều cao hơn. Để trực quan hóa các điểm dữ liệu n chiều, kỹ thuật tọa độ song song vẽ n trục cách đều nhau, mỗi trục một chiều, song song với một trong các trục hiển thị.

Hình ảnh hóa tập dữ liệu 3-D bằng cách sử dụng biểu đồ phân tán.

Một hạn chế chính của kỹ thuật tọa độ song song là nó không thể hiển thị một cách hiệu quả một tập dữ liệu gồm nhiều bản ghi. Ngay cả đối với một tập dữ liệu gồm vài nghìn bản ghi, sự lộn xộn và chồng chéo trực quan thường làm giảm khả năng đọc trực quan và làm cho các mẫu khó tìm thấy.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now