Có các kỹ thuật tối ưu hóa chung sau đây để tính toán hiệu quả các khối dữ liệu như sau -
-
Sắp xếp, băm và nhóm - Các thao tác sắp xếp, băm và nhóm nên được sử dụng cho các thuộc tính thứ nguyên để sắp xếp lại và phân cụm các bộ giá trị liên quan. Trong tính toán khối lập phương, tổng hợp được thực hiện trên các bộ giá trị (hoặc ô) có chung một bộ giá trị thứ nguyên tương tự. Do đó, điều cần thiết là phải khám phá các dịch vụ sắp xếp, băm và nhóm để truy cập và nhóm dữ liệu đó nhằm thúc đẩy việc tính toán các tổng hợp đó.
Ví dụ:nó có thể đánh giá tổng doanh số bán hàng theo chi nhánh, ngày và mặt hàng, sẽ hiệu quả hơn nếu sắp xếp các bộ giá trị hoặc ô theo chi nhánh và do đó theo ngày, sau đó nhóm chúng theo tên mặt hàng. Việc triển khai hiệu quả các hoạt động như vậy trong các tập dữ liệu khổng lồ đã được tính toán rộng rãi trong cộng đồng nghiên cứu cơ sở dữ liệu. Việc triển khai như vậy có thể được tính toán để tính toán khối dữ liệu.
-
Kết quả trung gian tổng hợp và lưu vào bộ nhớ đệm đồng thời - Trong tính toán khối lập phương, việc tính toán các tổng mức cao hơn từ các tổng mức thấp hơn đã được tính toán trước đó, thay vì từ bảng dữ kiện cơ sở là đủ. Hơn nữa, việc tổng hợp đồng thời từ các kết quả tính toán trung gian đã lưu trong bộ nhớ cache có thể dẫn đến việc giảm các hoạt động vào / ra đĩa tốn kém.
Ví dụ:nó có thể tính toán doanh số bán hàng theo chi nhánh hoặc có thể sử dụng các kết quả trung gian được thay đổi từ việc tính toán khối lập phương cấp thấp hơn, bao gồm cả doanh số bán hàng theo chi nhánh và ngày. Phương pháp này có thể được mở rộng để thực hiện quét phân bổ (tức là tính toán đồng thời nhiều khối lập phương nhất có thể để phân bổ số lần đọc đĩa).
-
Tổng hợp từ hình khối con nhỏ nhất, khi tồn tại nhiều hình khối con - Khi tồn tại một số hình khối con, nhìn chung sẽ hiệu quả hơn để đánh giá hình khối mẹ mong muốn (tức là tổng quát hơn) từ hình khối con nhỏ nhất, đã được tính toán trước đây.
Ví dụ:nó có thể tính toán một khối bán hàng, C Branch , khi tồn tại hai khối lập phương đã tính toán trước đó, C {Branch, Year} và C {Branch, Item} , sẽ hiệu quả hơn khi tính toán C Branch từ cái trước so với cái sau nếu có nhiều mục khác biệt hơn so với các năm khác nhau.
-
Phương pháp cắt tỉa Apriori có thể được khám phá để tính toán các khối tảng băng trôi một cách hiệu quả - Thuộc tính Apriori trong ngữ cảnh khối dữ liệu, phát biểu như sau:Nếu một ô nhất định không đáp ứng hỗ trợ tối thiểu, thì không có con nào (tức là phiên bản chức năng hơn hoặc chính xác hơn) của ô đó sẽ đáp ứng hỗ trợ tối thiểu. Thuộc tính này có thể được sử dụng để giảm đáng kể việc tính toán các khối tảng băng trôi.
Đặc điểm kỹ thuật của khối tảng băng trôi bao gồm điều kiện tảng băng trôi, là một hạn chế đối với các tế bào được vật chất hóa. Một điều kiện tảng băng phổ biến là các ô phải đáp ứng ngưỡng hỗ trợ tối thiểu, bao gồm số hoặc tổng tối thiểu. Trong trường hợp này, thuộc tính Apriori có thể được sử dụng để rút ngắn việc khám phá các phần tử con của ô.