Rate this post

Star Schema là dạng cơ bản của mô hình chiều, trong đó dữ liệu được tổ chức thành các dữ kiện và các chiều. Thực tế là một sự kiện được tính hoặc đo lường, chẳng hạn như bán hàng hoặc đăng nhập. Thứ nguyên bao gồm dữ liệu tham chiếu về thực tế, chẳng hạn như ngày, mặt hàng hoặc khách hàng.

Star Schema là dạng cơ bản của mô hình chiều, trong đó dữ liệu được tổ chức thành các dữ kiện và các chiều. Thực tế là một sự kiện được tính hoặc đo lường, chẳng hạn như bán hàng hoặc đăng nhập. Thứ nguyên bao gồm dữ liệu tham chiếu về thực tế, chẳng hạn như ngày, mặt hàng hoặc khách hàng.

Star Schema là một lược đồ quan hệ trong đó một lược đồ quan hệ có thiết kế đại diện cho một mô hình dữ liệu đa chiều. Star Schema là lược đồ kho dữ liệu rõ ràng. Nó được gọi là giản đồ sao vì biểu đồ mối quan hệ thực thể của lược đồ này mô phỏng một ngôi sao, với các điểm, phân kỳ từ một bảng trung tâm. Trung tâm của lược đồ bao gồm một bảng dữ kiện lớn và các điểm của ngôi sao là bảng kích thước.

Fact Tables

Một bảng trong giản đồ hình sao chứa dữ kiện và được kết nối với các thứ nguyên. Bảng dữ kiện có hai loại cột: cột bao gồm dữ liệu và cột là khóa ngoại của bảng thứ nguyên. Khóa chính của bảng dữ kiện nói chung là một khóa tổng hợp được tạo thành từ tất cả các khóa ngoại của nó.

Một bảng dữ kiện có thể liên quan đến thông tin thực tế ở cấp độ chi tiết hoặc thông tin thực tế đã được tổng hợp (các bảng thông tin thực tế bao gồm thông tin thực tế tổng hợp thường được gọi là bảng tóm tắt). Một bảng dữ kiện thường chứa các dữ kiện có cùng mức độ tổng hợp.

Dimension Tables

Dimension là một kiến ​​trúc thường bao gồm một hoặc nhiều cấu trúc phân cấp để phân loại dữ liệu. Nếu một thứ nguyên không có thứ bậc và cấp, nó được gọi là thứ nguyên phẳng hoặc danh sách. Các khóa chính của mỗi bảng kích thước là một phần của các khóa chính tổng hợp của bảng dữ kiện. Thuộc tính thứ nguyên giúp xác định giá trị thứ nguyên. Chúng thường là các giá trị mang tính mô tả, văn bản. Bảng kích thước thường có kích thước nhỏ hơn bảng thực tế.

Bảng dữ liệu lưu trữ dữ liệu về doanh số bán hàng trong khi bảng thứ nguyên dữ liệu về khu vực địa lý (thị trường, thành phố), khách hàng, sản phẩm, thời gian, kênh.

Đặc điểm của Star Schema

Star Schema rất thích hợp cho việc thiết kế cơ sở dữ liệu kho dữ liệu vì các tính năng sau:

  • Nó tạo ra một cơ sở dữ liệu chuẩn hóa DE có thể nhanh chóng cung cấp các phản hồi truy vấn.
  • Nó cung cấp một thiết kế linh hoạt có thể dễ dàng thay đổi hoặc thêm vào trong suốt chu kỳ phát triển và khi cơ sở dữ liệu phát triển.
  • Nó cung cấp sự song song trong thiết kế về cách người dùng cuối thường nghĩ và sử dụng dữ liệu.
  • Nó làm giảm sự phức tạp của siêu dữ liệu cho cả nhà phát triển và người dùng cuối.

Ưu điểm của giản đồ sao

Sơ đồ hình sao dễ dàng cho người dùng cuối và ứng dụng hiểu và điều hướng. Với một lược đồ được thiết kế tốt, khách hàng có thể phân tích ngay lập tức các tập dữ liệu lớn, đa chiều.

Ưu điểm chính của giản đồ hình sao trong môi trường hỗ trợ quyết định là:

Hiệu suất truy vấn

Cơ sở dữ liệu Star Schema có một số lượng hạn chế bảng và các đường dẫn tham gia rõ ràng, truy vấn chạy nhanh hơn so với các hệ thống OLTP. Các truy vấn một bảng nhỏ, thường là một bảng thứ nguyên, gần như là tức thời. Các truy vấn nối lớn chứa nhiều bảng chỉ mất vài giây hoặc vài phút để chạy.

Trong thiết kế cơ sở dữ liệu Star Schema, thứ nguyên chỉ được kết nối thông qua bảng dữ kiện trung tâm. Khi bảng hai thứ nguyên được sử dụng trong một truy vấn, chỉ có một đường dẫn nối, giao nhau giữa các bảng dữ kiện, tồn tại giữa hai bảng đó. Tính năng thiết kế này thực thi các kết quả truy vấn xác thực và nhất quán.

Tải hiệu suất và quản trị

Sự đơn giản về cấu trúc cũng làm giảm thời gian cần thiết để tải hàng loạt bản ghi lớn vào cơ sở dữ liệu Star Schema. Bằng cách mô tả các dữ kiện và kích thước và tách chúng thành các bảng khác nhau, tác động của cấu trúc tải được giảm bớt. Bảng thứ nguyên có thể được điền một lần và đôi khi được làm mới. Chúng ta có thể thêm các dữ kiện mới một cách thường xuyên và có chọn lọc bằng cách thêm các bản ghi vào một bảng dữ kiện.

Tính toàn vẹn tham chiếu được tích hợp sẵn

Star Schema được tích hợp sẵn tính toàn vẹn tham chiếu khi tải thông tin. Tính toàn vẹn tham chiếu được thực thi vì mỗi dữ liệu trong bảng chiều có một khóa chính duy nhất và tất cả các khóa trong bảng dữ kiện là khóa ngoại hợp pháp được rút ra từ bảng thứ nguyên. Bản ghi trong bảng dữ kiện không liên quan chính xác đến một thứ nguyên không thể được cung cấp giá trị khóa chính xác cần truy xuất.

Được hiểu dễ dàng

Star Schema rất đơn giản để hiểu và điều hướng, với các thứ nguyên chỉ được kết hợp thông qua bảng dữ kiện. Những liên kết này có ý nghĩa hơn đối với người dùng cuối vì chúng đại diện cho mối quan hệ cơ bản giữa các bộ phận của doanh nghiệp cơ bản. Khách hàng cũng có thể duyệt qua các thuộc tính bảng thứ nguyên trước khi tạo truy vấn.

Nhược điểm của Star Schema

Có một số điều kiện mà Star Schema không thể đáp ứng được như mối quan hệ giữa người dùng và tài khoản ngân hàng không thể mô tả dưới dạng giản đồ sao vì mối quan hệ giữa chúng là nhiều với nhiều.

Ví dụ: Giả sử một giản đồ hình sao bao gồm một bảng dữ kiện, SALES và một số bảng thứ nguyên được kết nối với nó cho thời gian, chi nhánh, mặt hàng và vị trí địa lý.

Bảng TIME có một cột cho mỗi ngày,tháng, quý và năm. Bảng ITEM có các cột cho từng item_Key, item_name, brand, type, provider_type. Bảng BRANCH có các cột cho mỗi branch_key, branch_name, branch_type. Bảng LOCATION có các cột dữ liệu địa lý, bao gồm đường phố, thành phố, tiểu bang và quốc gia.

Trong trường hợp này, bảng SALES chỉ chứa bốn cột có ID từ bảng thứ nguyên, TIME, ITEM, BRANCH và LOCATION, thay vì bốn cột cho dữ liệu thời gian, bốn cột cho dữ liệu ITEM, ba cột cho dữ liệu BRANCH và bốn cột cho dữ liệu LOCATION. Như vậy, kích thước của bảng dữ kiện được giảm đi đáng kể. Khi cần thay đổi một mục, chúng ta chỉ cần thực hiện một thay đổi duy nhất trong bảng thứ nguyên, thay vì thực hiện nhiều thay đổi trong bảng dữ kiện.

Chúng ta có thể tạo các Star Schema phức tạp hơn nữa bằng cách chuẩn hóa bảng kích thước thành nhiều bảng. Bảng kích thước chuẩn hóa được gọi là Snowflake.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now