OLAM là viết tắt của khai thác phân tích trực tuyến. Nó còn được gọi là Khai thác OLAP. Nó tích hợp xử lý phân tích trực tuyến với khai thác dữ liệu và khai thác kiến thức trong cơ sở dữ liệu đa chiều. Có một số mô hình và cấu trúc của hệ thống khai thác dữ liệu.
Các công cụ khai thác dữ liệu khác nhau phải hoạt động trên dữ liệu tích hợp, nhất quán và được làm sạch. Điều này đòi hỏi quá trình xử lý trước tốn kém để làm sạch dữ liệu, chuyển đổi dữ liệu và tích hợp dữ liệu. Do đó, một kho dữ liệu được xây dựng bằng cách xử lý trước như vậy là một nguồn thông tin chất lượng cao có giá trị cho cả OLAP và khai thác dữ liệu. Khai thác dữ liệu có thể đóng vai trò như một công cụ có giá trị để làm sạch dữ liệu và tích hợp dữ liệu.
OLAM đặc biệt quan trọng vì những lý do sau đây như sau -
Chất lượng cao của dữ liệu trong kho dữ liệu - Hầu hết các công cụ khai thác dữ liệu được yêu cầu hoạt động trên thông tin tích hợp, nhất quán và đã được làm sạch, những thông tin này cần làm sạch dữ liệu tốn kém, tích hợp dữ liệu và chuyển đổi dữ liệu như một giai đoạn tiền xử lý. Kho dữ liệu được xây dựng bằng cách xử lý trước như vậy đóng vai trò là nguồn dữ liệu chất lượng cao có giá trị cho OLAP và khai thác dữ liệu. Khai thác dữ liệu cũng có thể đóng vai trò như một công cụ có giá trị để làm sạch dữ liệu và tích hợp dữ liệu.
Cơ sở hạ tầng xử lý thông tin có sẵn xung quanh kho dữ liệu - Cơ sở hạ tầng xử lý dữ liệu và phân tích dữ liệu toàn diện đã hoặc sẽ được xây dựng có trật tự xung quanh các kho dữ liệu, bao gồm việc truy cập, tích hợp, hợp nhất và chuyển đổi các cơ sở dữ liệu không đồng nhất khác nhau, các kết nối ODBC / OLE DB, các cơ sở dịch vụ và truy cập web cũng như tài liệu và Các công cụ phân tích OLAP. Cần cẩn thận để tạo ra việc sử dụng tốt nhất các cơ sở hạ tầng sẵn có thay vì xây dựng mọi thứ từ đầu.
Phân tích dữ liệu khám phá dựa trên OLAP - Khai thác dữ liệu hiệu quả yêu cầu phân tích dữ liệu khám phá. Người dùng sẽ được yêu cầu duyệt qua cơ sở dữ liệu, chọn các vùng thông tin có liên quan, phân tích chúng ở nhiều mức độ chi tiết và hiển thị kiến thức / kết quả ở nhiều dạng.
Khai thác phân tích trực tuyến hỗ trợ các phương tiện để khai thác dữ liệu trên nhiều tập hợp con dữ liệu và ở một số cấp độ trừu tượng, bằng cách khoan, xoay, lọc, cắt và cắt trên một khối dữ liệu và một số kết quả khai thác dữ liệu trung gian.
Lựa chọn trực tuyến các chức năng khai thác dữ liệu - Nó hỗ trợ người dùng không thể hiểu loại kiến thức họ muốn khai thác. Bằng cách tích hợp OLAP với các chức năng khai thác dữ liệu khác nhau, khai thác phân tích trực tuyến cung cấp cho người dùng sự linh hoạt để chọn các chức năng khai thác dữ liệu mong muốn và hoán đổi các nhiệm vụ khai thác dữ liệu một cách linh hoạt.