Computer >> Máy Tính >  >> Lập trình >> Lập trình

Khai thác dữ liệu liên quan như thế nào đến xử lý thông tin và xử lý phân tích trực tuyến?

Có ba loại ứng dụng kho dữ liệu như xử lý thông tin, xử lý phân tích và khai thác dữ liệu.

Xử lý thông tin - Nó cung cấp khả năng truy vấn, phân tích số cơ bản và lập tài liệu bằng cách sử dụng chéo bảng, bảng, biểu đồ hoặc đồ thị. Xu hướng hiện đại trong xử lý dữ liệu kho dữ liệu là tạo ra các công cụ truy cập dựa trên web chi phí thấp được tích hợp với các trình duyệt web.

Xử lý phân tích - Nó cung cấp các hoạt động OLAP cơ bản, chẳng hạn như cắt và xúc xắc, xem chi tiết, cuộn lên và xoay vòng. Nó thường hoạt động dựa trên thông tin lịch sử ở cả dạng tóm tắt và chi tiết. Lĩnh vực chính của xử lý phân tích trực tuyến qua xử lý thông tin là phân tích thông tin đa chiều của dữ liệu kho dữ liệu.

Khai thác dữ liệu - Nó cung cấp khả năng khám phá kiến ​​thức bằng cách khám phá các mô hình và liên kết ẩn, tạo mô hình phân tích, thực hiện phân loại và dự đoán, đồng thời hiển thị kết quả khai thác bằng cách sử dụng các công cụ trực quan hóa.

Xử lý thông tin dựa trên truy vấn, có thể khám phá dữ liệu hữu ích. Nó có thể trả lời cho các truy vấn như vậy phản ánh dữ liệu được lưu trực tiếp trong cơ sở dữ liệu hoặc có thể tính toán được bởi các dịch vụ tổng hợp. Chúng không phản ánh các thiết kế phức tạp hoặc khả năng dự đoán bị chôn vùi trong cơ sở dữ liệu. Do đó, xử lý thông tin không phải là khai thác dữ liệu.

Xử lý phân tích trực tuyến tiến gần hơn đến khai thác dữ liệu vì nó có thể thay đổi dữ liệu được tóm tắt ở một số mức độ chi tiết từ các tập con do người dùng xác định của kho dữ liệu. Các dịch vụ của OLAP và khai thác dữ liệu có thể được coi là rời rạc -

OLAP là một công cụ tổng hợp / tóm tắt dữ liệu hỗ trợ dễ dàng phân tích dữ liệu, trong khi khai thác dữ liệu cho phép tự động khám phá các thiết kế ngầm và kiến ​​thức thú vị ẩn trong một lượng lớn dữ liệu.

Các công cụ OLAP được nhắm mục tiêu theo hướng đơn giản hóa và cung cấp phân tích dữ liệu tương tác, trong khi mục tiêu của các công cụ khai thác dữ liệu là tự động hóa càng nhiều quy trình càng tốt, đồng thời cho phép người dùng hỗ trợ quy trình. Trong phương pháp này, khai thác dữ liệu tiến thêm một giai đoạn nữa là xử lý phân tích trực tuyến truyền thống.

Một quan điểm thay thế về khai thác dữ liệu có thể được áp dụng trong đó khai thác dữ liệu bao gồm cả định nghĩa dữ liệu và mô hình dữ liệu. Bởi vì hệ thống OLAP có thể hiển thị định nghĩa chung về thông tin từ kho dữ liệu, các dịch vụ OLAP về cơ bản là để tổng hợp và so sánh dữ liệu theo hướng người dùng (bằng cách khoan, xoay, cắt, cắt, v.v.).

Khai phá dữ liệu không chỉ giới hạn ở việc phân tích dữ liệu được lưu trong kho dữ liệu. Nó có thể khám phá dữ liệu hiện có ở mức độ chi tiết hơn so với các bản ghi tóm tắt được hỗ trợ trong kho dữ liệu.

Nó cũng có thể khám phá các bản ghi giao dịch, không gian, văn bản và đa phương tiện phức tạp để tạo mô hình bằng công nghệ cơ sở dữ liệu đa chiều hiện đại. Trong bối cảnh này, khai thác dữ liệu bao gồm một phạm vi rộng hơn so với OLAP liên quan đến các dịch vụ khai thác dữ liệu và độ phức tạp của dữ liệu được quản lý.