Computer >> Máy Tính >  >> Lập trình >> Lập trình

Cấu trúc cho Khai thác Phân tích Trực tuyến là gì?

Máy chủ OLAM thực hiện khai thác phân tích trong các khối dữ liệu tương tự như máy chủ OLAP thực hiện xử lý phân tích trực tuyến. Cơ chế OLAM và OLAP tích hợp, trong đó máy chủ OLAM và OLAP đều chấp nhận các truy vấn trực tuyến của người dùng (hoặc lệnh) thông qua API giao diện người dùng đồ họa và hoạt động với khối dữ liệu trong phân tích dữ liệu thông qua API khối.

Một thư mục siêu dữ liệu có thể được sử dụng để hướng dẫn truy cập khối dữ liệu. Khối dữ liệu có thể được tạo bằng cách truy cập và tích hợp nhiều cơ sở dữ liệu thông qua API MDDB và bằng cách lọc kho dữ liệu thông qua API cơ sở dữ liệu có thể cung cấp kết nối OLE DB hoặc ODBC.

Bởi vì máy chủ OLAM có thể triển khai một số tác vụ khai thác dữ liệu, bao gồm mô tả khái niệm, liên kết, phân loại, dự đoán, phân cụm, phân tích chuỗi thời gian, v.v. Nó thường bao gồm nhiều mô-đun khai thác dữ liệu tích hợp và phức tạp hơn máy chủ OLAP.

Một công cụ OLAM có thể thực hiện nhiều tác vụ khai thác dữ liệu, chẳng hạn như mô tả khái niệm, liên kết, phân loại, dự đoán, phân cụm và phân tích chuỗi thời gian. Do đó, nó thường bao gồm nhiều mô-đun khai thác dữ liệu tích hợp, làm cho nó trở nên phức tạp hơn một công cụ OLAP. Không có sự khác biệt cơ bản giữa khối dữ liệu cần thiết cho OLAP và khối dữ liệu cho OLAM, mặc dù phân tích OLAM có thể yêu cầu các công cụ truy cập và xây dựng khối dữ liệu mạnh mẽ hơn.

Đây là trường hợp khi OLAM liên quan đến nhiều thứ nguyên hơn với độ chi tiết tốt hơn hoặc liên quan đến việc khám phá theo hướng khám phá các tổng hợp đa tính năng trên khối dữ liệu, do đó yêu cầu nhiều hơn phân tích OLAP. Hơn nữa, khi khai thác dữ liệu thăm dò xác định các điểm thú vị, công cụ OLAM có thể cần phải đi sâu từ khối dữ liệu vào cơ sở dữ liệu quan hệ tương ứng để phân tích chi tiết các phần dữ liệu cụ thể.

Đây là trường hợp khi OLAM liên quan đến nhiều thứ nguyên hơn với độ chi tiết tốt hơn hoặc liên quan đến việc khám phá theo hướng khám phá các tổng hợp đa tính năng trên khối dữ liệu, do đó yêu cầu nhiều hơn phân tích OLAP. Hơn nữa, khi khai thác dữ liệu thăm dò xác định các điểm thú vị, công cụ OLAM có thể cần phải đi sâu từ khối dữ liệu vào cơ sở dữ liệu quan hệ tương ứng để phân tích chi tiết các phần dữ liệu cụ thể.

Hơn nữa, quá trình khai thác dữ liệu có thể tiết lộ rằng các kích thước hoặc số đo của một hình khối được xây dựng không phù hợp để phân tích dữ liệu. Ở đây, một thiết kế khối dữ liệu tinh chỉnh có thể cải thiện chất lượng của việc xây dựng kho dữ liệu.

Khai thác dữ liệu hiệu quả yêu cầu phân tích dữ liệu khám phá. Người dùng thường muốn xem qua cơ sở dữ liệu, chọn các phần dữ liệu có liên quan, phân tích chúng ở các mức độ chi tiết khác nhau và trình bày kiến ​​thức / kết quả ở các dạng khác nhau.

Khai thác phân tích trực tuyến cung cấp các phương tiện để khai thác dữ liệu trên các tập hợp con dữ liệu khác nhau và ở các mức độ trừu tượng khác nhau. Nó có thể đạt được điều này bằng cách khoan, xoay, lọc, dò tìm và cắt trên một khối dữ liệu và các kết quả khai thác dữ liệu trung gian. Điều này, cùng với các công cụ trực quan hóa dữ liệu / tri thức, có thể làm tăng cao sức mạnh và khả năng thích ứng của việc khai thác dữ liệu khám phá.