Computer >> Máy Tính >  >> Lập trình >> Lập trình

Data Cube là gì?

Một khối dữ liệu cho phép dữ liệu được mô hình hóa và xem theo nhiều chiều. Nó được thể hiện bằng các kích thước và sự kiện. Nói cách khác, thứ nguyên là các khung nhìn hoặc thực thể liên quan đến mà một tổ chức được yêu cầu lưu giữ hồ sơ.

Ví dụ:AllElectronics có thể tạo kho dữ liệu bán hàng để duy trì hồ sơ về thời gian, mặt hàng, chi nhánh và vị trí liên quan đến các thứ nguyên liên quan đến bán hàng của cửa hàng. Những thứ nguyên này cho phép cửa hàng duy trì theo dõi những thứ như doanh số bán các mặt hàng hàng tháng cũng như các chi nhánh và địa điểm mà tại đó các mặt hàng đã được bán.

Mỗi thứ nguyên có thể có một bảng liên quan đến nó. Nó được gọi là một bảng kích thước, biểu thị thêm thứ nguyên. Ví dụ:bảng thứ nguyên cho một mặt hàng có thể bao gồm tên, thương hiệu và loại thuộc tính của mặt hàng. Bảng thứ nguyên có thể được xác định bởi người dùng hoặc chuyên gia hoặc được tạo và điều chỉnh tự động được thiết lập trên các bản phân phối dữ liệu.

Mô hình dữ liệu đa chiều thường được tổ chức xung quanh một thiết kế trung tâm, chẳng hạn như doanh số bán hàng. Thiết kế này được xác định bởi một bảng dữ kiện. Sự kiện là các thước đo toán học. Ví dụ về dữ kiện cho kho dữ liệu bán hàng chứa đô la đã bán (số tiền bán hàng tính bằng đô la), đơn vị đã bán (số đơn vị đã bán) và số tiền được lập ngân sách. Bảng dữ kiện bao gồm tên của dữ kiện hoặc thước đo và chìa khóa cho mỗi bảng thứ nguyên liên quan.

Một khối dữ liệu được tạo ra từ một tập hợp con các thuộc tính trong cơ sở dữ liệu. Các thuộc tính cụ thể được chọn để trở thành các thuộc tính đo lường, tức là các thuộc tính có giá trị được quan tâm. Các thuộc tính khác được chọn làm thứ nguyên hoặc thuộc tính chức năng. Các thuộc tính đo lường được tổng hợp theo thứ nguyên.

Ví dụ:XYZ có thể tạo một kho dữ liệu bán hàng để duy trì hồ sơ về doanh số của cửa hàng cho các thứ nguyên về thời gian, mặt hàng, chi nhánh và địa điểm. Những thứ nguyên này cho phép cửa hàng duy trì theo dõi những thứ như doanh số bán các mặt hàng hàng tháng cũng như các chi nhánh và địa điểm mà tại đó các mặt hàng đã được bán.

Mỗi thứ nguyên có thể có một bảng được nhận dạng với nó. Nó được gọi là một bảng chiều, xác định các kích thước. Ví dụ:bảng thứ nguyên cho các mặt hàng có thể bao gồm các thuộc tính item_name, brand và type.

Kỹ thuật khối dữ liệu là một phương pháp thú vị với một số ứng dụng. Các khối dữ liệu có thể thưa thớt trong một số trường hợp vì không phải mọi ô trong mỗi chiều đều có thể có thông tin tương ứng trong cơ sở dữ liệu. Nếu một truy vấn bao gồm các hằng số ở cấp độ thậm chí thấp hơn những hằng số được hỗ trợ trong khối dữ liệu, thì không rõ cách phát triển việc sử dụng tốt nhất các kết quả được tính toán trước được lưu trong khối dữ liệu.