Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các kỹ thuật cho Data Cube Computations là gì?

Sau đây là các kỹ thuật tối ưu hóa chung để tính toán hiệu quả các khối dữ liệu như sau -

Sắp xếp, băm và nhóm - Các thao tác sắp xếp, băm và nhóm phải được sử dụng cho các thuộc tính thứ nguyên để sắp xếp lại và phân cụm các bộ giá trị liên quan. Trong tính toán khối lập phương, tổng hợp được thực hiện trên các bộ giá trị chia sẻ tập giá trị thứ nguyên tương tự. Do đó, điều cần thiết là phải phân tích các dịch vụ sắp xếp, băm và nhóm để truy cập và nhóm dữ liệu đó để hỗ trợ đánh giá các tổng hợp đó.

Nó có thể tính toán tổng doanh số bán hàng theo chi nhánh, ngày và mặt hàng. Có thể hiệu quả hơn nếu sắp xếp các bộ dữ liệu hoặc ô theo nhánh, và do đó theo ngày, sau đó nhóm chúng theo tên mục. Hiệu suất hiệu quả của các hoạt động như vậy trong các tập dữ liệu khổng lồ đã được xem xét rộng rãi trong cộng đồng nghiên cứu cơ sở dữ liệu.

Hiệu suất như vậy có thể được tiếp tục tính toán khối dữ liệu. Phương pháp này cũng có thể được tiếp tục triển khai chia sẻ sắp xếp (nghĩa là chia sẻ chi phí sắp xếp trên các hình khối khác nhau khi các kỹ thuật dựa trên sắp xếp được sử dụng) hoặc để triển khai phân vùng chia sẻ (nghĩa là chia sẻ chi phí phân vùng trên các hình khối khác nhau khi các thuật toán dựa trên băm được sử dụng).

Tổng hợp đồng thời và lưu vào bộ nhớ đệm của các kết quả trung gian - Trong tính toán khối lập phương, sẽ có hiệu quả khi tính các tổng cấp cao hơn từ các tổng cấp thấp hơn đã được tính toán trước đó, thay vì từ bảng dữ kiện cơ sở. Hơn nữa, việc tổng hợp đồng thời từ các kết quả tính toán trung gian được lưu trong bộ nhớ đệm có thể dẫn đến sự suy giảm các hoạt động nhập / xuất đĩa (I / O) có giá cao.

Ví dụ, nó có thể tính toán doanh số bán hàng theo chi nhánh, nó có thể sử dụng các kết quả trung gian được thay đổi từ việc tính toán khối lập phương cấp thấp hơn bao gồm doanh số bán hàng theo chi nhánh và ngày. Phương pháp này có thể được tiếp tục triển khai tính năng quét phân bổ (tức là tính toán đồng thời nhiều khối lập phương nhất có thể để phân bổ số lần đọc đĩa).

Tổng hợp từ con nhỏ nhất khi tồn tại nhiều hình khối con - Khi tồn tại một số hình khối con, nhìn chung sẽ hiệu quả hơn khi tính toán hình khối mẹ mong muốn (tức là tổng quát hơn) từ hình khối con nhỏ nhất, được tính toán trước đây.

Phương pháp cắt tỉa Apriori có thể được khám phá để tính toán các khối tảng băng trôi một cách hiệu quả - Thuộc tính Apriori trong ngữ cảnh khối dữ liệu, được định nghĩa như sau:Nếu một ô nhất định không đáp ứng hỗ trợ tối thiểu, do đó không có con nào của ô (tức là ô cụ thể hơn) sẽ đáp ứng hỗ trợ tối thiểu. Thuộc tính này có thể được sử dụng để giảm phần lớn tính toán của các khối tảng băng trôi.

Mô tả về khối tảng băng trôi bao gồm điều kiện tảng băng trôi, là một hạn chế đối với các tế bào được vật chất hóa. Một điều kiện tảng băng chung là các ô phải đáp ứng ngưỡng hỗ trợ tối thiểu bao gồm tổng hoặc tổng số tối thiểu. Trong thuật ngữ này, thuộc tính Apriori có thể được sử dụng để rút ngắn quá trình kiểm tra con cháu của ô.