Các thành phần chính của kho dữ liệu như sau -
Nguồn dữ liệu - Nguồn dữ liệu xác định một kho lưu trữ hồ sơ điện tử bao gồm dữ liệu quan tâm cho việc sử dụng quản trị hoặc phân tích. Khung chính của cơ sở dữ liệu (ví dụ:IBM DB2, ISAM, Adabas, Teradata, v.v.), cơ sở dữ liệu máy khách-máy chủ (ví dụ:Teradata, IBM DB2, cơ sở dữ liệu Oracle, Informix, Microsoft SQL Server, v.v.), cơ sở dữ liệu PC (ví dụ:Microsoft Access, Alpha Five), bảng tính (ví dụ:Microsoft Excel) và bất kỳ kho lưu trữ dữ liệu điện tử nào khác.
Kho dữ liệu - Kho dữ liệu thông thường là cơ sở dữ liệu quan hệ. Nó phải được tổ chức để giữ dữ liệu trong một cấu trúc hỗ trợ tốt nhất không chỉ cho truy vấn và lập tài liệu mà còn cả các kỹ thuật phân tích nâng cao, chẳng hạn như khai thác dữ liệu.
Báo cáo - Dữ liệu trong kho dữ liệu phải có sẵn cho nhân viên của tổ chức nếu kho dữ liệu là hữu ích. Có một số lượng lớn các ứng dụng phần mềm thực hiện chức năng này hoặc báo cáo có thể được phát triển tùy chỉnh. Các công cụ báo cáo bao gồm như sau:
-
Công cụ thông minh kinh doanh - Đây là những ứng dụng phần mềm làm rõ quá trình phát triển và sản xuất các tài liệu kinh doanh dựa trên thông tin kho dữ liệu.
-
Hệ thống thông tin điều hành (được biết đến rộng rãi hơn là Trang tổng quan (doanh nghiệp) - Đây là các ứng dụng phần mềm được sử dụng để hiển thị các số liệu kinh doanh phức tạp và thông tin bằng đồ thị để cho phép hiểu nhanh chóng.
-
Khai thác dữ liệu - Công cụ khai thác dữ liệu là phần mềm cho phép người dùng thực hiện các tính toán số và thống kê chi tiết trên dữ liệu kho dữ liệu chi tiết để phát hiện xu hướng, xác định thiết kế và phân tích dữ liệu.
Siêu dữ liệu - Siêu dữ liệu là dữ liệu về dữ liệu mà người dùng cần. Nó không chỉ được sử dụng để hướng dẫn người vận hành và người sử dụng kho dữ liệu về trạng thái của nó và dữ liệu được lưu giữ bên trong kho dữ liệu mà còn được sử dụng như một phương tiện tích hợp thông tin đến và một công cụ để nâng cấp và hoàn thiện mô hình kho dữ liệu cơ bản.
Hoạt động - Hoạt động của kho dữ liệu bao gồm các quá trình tải, thao tác và trích xuất thông tin từ kho dữ liệu. Các hoạt động cũng bao gồm quản lý người dùng, bảo mật, quản lý năng lực và các chức năng liên quan.
Thành phần tùy chọn - Có những thành phần sau tồn tại trong một số kho dữ liệu như sau -
-
Marts dữ liệu phụ thuộc - Kho dữ liệu phụ thuộc là một cơ sở dữ liệu vật lý (trên cùng một phần cứng với kho dữ liệu hoặc trên một nền tảng phần cứng riêng biệt) nhận tất cả thông tin của nó từ kho dữ liệu.
-
Marts dữ liệu lôgic - Kho dữ liệu lôgic là chế độ xem được lọc của kho dữ liệu chính nhưng không tồn tại về mặt vật lý như một bản sao dữ liệu độc lập.
-
Lưu trữ dữ liệu hoạt động - ODS là một cơ sở dữ liệu tích hợp của dữ liệu hoạt động. Nguồn của nó chứa các hệ thống kế thừa và nó bao gồm thông tin hiện tại hoặc gần hạn.