Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các công cụ OLAP trong khai thác dữ liệu là gì?

Có ba loại công cụ OLAP chính như sau -

MOLAP - MOLAP đại diện cho OLAP đa chiều. Nó hỗ trợ bộ giá trị làm đơn vị lưu trữ dữ liệu. MOLAP áp dụng công cụ lưu trữ mảng n-chiều chuyên dụng và phần mềm trung gian OLAP để xử lý dữ liệu. Do đó, các truy vấn OLAP được hoàn thành thông qua việc định địa chỉ trực tiếp đến các chế độ xem đa chiều được liên kết (khối dữ liệu).

Cấu trúc này tập trung vào việc tính toán trước thông tin giao dịch thành các tập hợp, dẫn đến hiệu suất thực thi truy vấn nhanh. Đặc biệt, MOLAP tính toán trước và lưu trữ các số đo tổng hợp ở mỗi cấp độ phân cấp tại thời điểm tải, đồng thời lưu trữ và lập chỉ mục các giá trị này để truy xuất ngay lập tức.

Việc tính toán trước đầy đủ cần một lượng lớn chi phí, cả về thời gian xử lý và vùng lưu trữ. Đối với dữ liệu thưa thớt, MOLAP cần các thuật toán nén ma trận thưa thớt để tăng cường sử dụng lưu trữ và do đó nói chung được đặc trưng bởi kích thước dữ liệu trên đĩa nhỏ hơn so với dữ liệu được lưu trong RDBMS.

Các sản phẩm dựa trên MOLAP sắp xếp, điều hướng và phân tích dữ liệu nói chung ở dạng tổng hợp. Họ cần kết hợp chặt chẽ với phần mềm và chúng dựa trên hệ thống cơ sở dữ liệu đa chiều (MDDB). Việc triển khai hiệu quả lưu dữ liệu theo cách tương tự như biểu mẫu mà dữ liệu được sử dụng bằng cách sử dụng các phương pháp lưu trữ cải tiến để giảm thiểu dung lượng lưu trữ.

ROLAP - ROLAP là viết tắt của Relational OLAP. Nó có thể lưu trữ dữ liệu dựa trên công nghệ DBMS quan hệ đã quen thuộc. Trong trường hợp này, dữ liệu và các tổng hợp liên quan được lưu trong RDBMS và phần mềm trung gian OLAP có thể triển khai việc quản lý và khám phá các khối dữ liệu.

Kiến trúc này nhắm mục tiêu tối ưu hóa phần cuối RDBMS và hỗ trợ các công cụ và dịch vụ bổ sung bao gồm logic điều hướng khối dữ liệu. Do việc sử dụng phần cuối RDBMS, lợi ích chính của ROLAP là khả năng mở rộng trong việc quản lý khối lượng dữ liệu lớn.

Hệ thống ROLAP hoạt động thường xuyên từ dữ liệu chiếm cơ sở dữ liệu quan hệ, nơi dữ liệu cơ sở và bảng thứ nguyên được lưu trữ dưới dạng bảng quan hệ. Mô hình này cho phép phân tích đa chiều các bản ghi.

Đây là phân khúc công nghệ OLAP mới nhất và phát triển nhanh nhất trong ngành. Phương pháp này cho phép tạo một số dạng xem đa chiều của bảng quan hệ hai chiều, ngăn việc cấu trúc các bản ghi xung quanh dạng xem mong muốn.

MQE - MQE là viết tắt của Managed Query Environment. Một số sản phẩm có thể cung cấp các truy vấn đặc biệt như khối dữ liệu và khả năng phân tích lát cắt và xúc xắc. Nó được thực hiện bằng cách phát triển một truy vấn để chọn dữ liệu từ DBMS, truy vấn này cung cấp dữ liệu được yêu cầu đến hệ thống nơi nó được đặt vào một khối dữ liệu.

Khối dữ liệu này có thể được lưu trữ cục bộ trong máy tính để bàn và cũng được thao tác ở đó để giảm chi phí, cần phải tạo cấu trúc mỗi khi thực thi truy vấn. Sau khi lưu trữ dữ liệu trong khối dữ liệu, các phép toán và phân tích đa chiều có thể được áp dụng cho nó.