Gần đây, các nhà nghiên cứu đã hướng sự chú ý của họ sang việc thu nhỏ dữ liệu đa chiều để khám phá kiến thức về các kết hợp chiều và độ chi tiết khác nhau. Khai thác như vậy còn được gọi là khai thác dữ liệu đa chiều thăm dò và khai […]
Category Archives: Data mining
Các data cube không bị giới hạn trong cấu trúc đa chiều đơn giản được cho các ứng dụng Data Warehouse kinh doanh điển hình. Các phương pháp được mô tả trong phần này phát triển thêm công nghệ data cube để xử lý hiệu quả các loại truy vấn nâng cao. Phần này khám […]
Các data cube tạo điều kiện thuận lợi cho việc xử lý phân tích trực tuyến dữ liệu đa chiều. “Nhưng làm thế nào chúng ta có thể tính toán trước các data cube để chúng tiện dụng và sẵn sàng cho việc xử lý truy vấn?” Phần này trái ngược việc vật chất hóa […]
Về mặt khái niệm, khối dữ liệu có thể được xem như một loại tổng hợp dữ liệu đa chiều. Nói chung, Data Generalization tóm tắt dữ liệu bằng cách thay thế các giá trị cấp tương đối thấp (ví dụ: giá trị số cho độ tuổi thuộc tính) bằng các khái niệm cấp cao […]
Bởi vì hầu hết mọi người đều quen thuộc với các hệ thống data base quan hệ thương mại, có thể dễ dàng hiểu warehouse là gì bằng cách so sánh hai loại hệ thống này. Các bài viết liên quan: Giới thiệu Database và Data Warehouse Database (Cơ sở dữ liệu) Database, hay còn […]
Phần này trình bày các phương pháp biến đổi dữ liệu. Trong bước tiền xử lý này, dữ liệu được chuyển đổi hoặc hợp nhất để quá trình khai thác kết quả có thể hiệu quả hơn và các mẫu được tìm thấy có thể dễ hiểu hơn. Sự tùy biến dữ liệu, một hình […]
Hãy tưởng tượng rằng bạn đã chọn dữ liệu từ kho dữ liệu AllElectronics để phân tích. Bộ dữ liệu có thể sẽ rất lớn! Việc phân tích và khai thác dữ liệu phức tạp trên một lượng lớn dữ liệu có thể mất nhiều thời gian, khiến việc phân tích như vậy trở nên […]
Dữ liệu trong thế giới thực có xu hướng không đầy đủ, nhiễu và không nhất quán. Các quy trình làm sạch dữ liệu (hoặc làm sạch dữ liệu) cố gắng điền vào các giá trị còn thiếu, loại bỏ nhiễu trong khi xác định các ngoại lệ và sửa chữa các điểm không nhất […]
Chất lượng dữ liệu: Tại sao phải xử lý trước dữ liệu? Dữ liệu có chất lượng nếu chúng đáp ứng các yêu cầu của mục đích sử dụng. Có nhiều yếu tố bao gồm chất lượng dữ liệu, bao gồm độ chính xác, đầy đủ, nhất quán, kịp thời, đáng tin cậy và khả […]
Đo lường sự giống nhau và không giống nhau của dữ liệu là kỹ thuật thường sử dụng trong trực quan hóa dữ liệu. Các bài viết liên quan: Trong các ứng dụng khai thác dữ liệu, chẳng hạn như phân nhóm, phân tích ngoại lệ và phân loại láng giềng gần nhất, chúng ta […]