Kho dữ liệu là một cách tiếp cận có thể thu thập và xử lý dữ liệu từ nhiều nguồn để cung cấp cho doanh nghiệp một cái nhìn sâu sắc về kinh doanh có ý nghĩa. Kho dữ liệu được thiết kế đặc biệt để hỗ trợ các quyết định quản lý.
Nói một cách dễ hiểu, kho dữ liệu xác định một cơ sở dữ liệu được duy trì độc lập với các cơ sở dữ liệu hoạt động của một tổ chức. Hệ thống kho dữ liệu cho phép tích hợp nhiều hệ thống ứng dụng. Họ cung cấp xử lý dữ liệu bằng cách cung cấp một nền tảng vững chắc gồm thông tin lịch sử, hợp nhất để phân tích.
Kho dữ liệu khái quát hóa và tập trung hóa dữ liệu trong không gian đa chiều. Sự phát triển của kho dữ liệu bao gồm làm sạch dữ liệu, tích hợp dữ liệu và chuyển đổi dữ liệu và có thể được xem như một bước tiền xử lý thiết yếu để khai thác dữ liệu.
OLAP là một cách tiếp cận xoay quanh việc lưu trữ dữ liệu. Trong mô hình này, dữ liệu được lưu ở định dạng cho phép tạo ra hiệu quả các tài liệu / khai thác dữ liệu. Thiết kế OLAP phải phù hợp với việc ghi lại tài liệu trên các tập bản ghi lớn với sự suy giảm nhỏ về hiệu quả hoạt động.
Toàn bộ thuật ngữ có thể đại diện cho việc lấy cấu trúc dữ liệu trong cấu trúc OLTP và ảnh hưởng đến dữ liệu tương tự trong kiến trúc OLAP là "Mô hình thứ nguyên". Đây là khối xây dựng cơ bản của Kho dữ liệu.
Việc kiểm tra kho dữ liệu sẽ kiểm tra chất lượng của dữ liệu, chẳng hạn như tính đầy đủ của dữ liệu để đảm bảo rằng tất cả dữ liệu dự kiến được tải và chuyển đổi dữ liệu để đảm bảo rằng tất cả dữ liệu được thay đổi một cách chính xác theo quy tắc kinh doanh hoặc thông số kỹ thuật thiết kế.
Kiểm tra môi trường hoạt động của kho dữ liệu là một bộ kiểm tra quan trọng khác sẽ phải được thực hiện. Có một số khía cạnh cần được kiểm tra như sau -
-
Tính bảo mật, rất khó để kiểm tra trừ khi nó được lập thành tài liệu, nhưng không được phép tiết lộ tất cả thông tin. Nếu có một tài liệu bảo mật kho dữ liệu riêng, thì việc kiểm tra sẽ là một vấn đề tương đối đơn giản là trích xuất danh sách các hoạt động không được phép và đặt ra một bài kiểm tra cho từng hoạt động. Tập hợp các bài kiểm tra này nên chạy nhiều lần trong quá trình kiểm tra hệ thống để đảm bảo rằng dữ liệu mới được thêm vào không phá vỡ giới hạn bảo mật.
-
Trong quá trình kiểm tra hệ thống, cấu hình đĩa phải được kiểm tra kỹ lưỡng để xác định bất kỳ nút thắt cổ chai I / O tiềm ẩn nào.
-
Nó có thể kiểm soát các hoạt động hàng ngày của kho dữ liệu, cần có một số phần mềm lập lịch và điều này cần được kiểm tra kỹ lưỡng trong quá trình kiểm tra hệ thống. Phần mềm lập lịch sẽ cần bộ lập lịch để kiểm soát việc xử lý quá mức và quản lý các tổng hợp.
Có nhiều thách thức khác nhau để kiểm tra kho dữ liệu như sau -
- Lựa chọn dữ liệu từ nhiều hệ thống nguồn.
- Khối lượng và độ phức tạp của dữ liệu.
- Thông tin không nhất quán và dư thừa trong kho dữ liệu.
- Không có thử nghiệm toàn diện.