Kho dữ liệu là một cách tiếp cận có thể thu thập và quản lý dữ liệu từ nhiều nguồn để cung cấp cho doanh nghiệp một cái nhìn sâu sắc về kinh doanh. Kho dữ liệu được thiết kế đặc biệt để đưa ra các quyết định quản lý.
Nói một cách dễ hiểu, kho dữ liệu xác định cơ sở dữ liệu được duy trì độc lập với cơ sở dữ liệu hoạt động của tổ chức. Hệ thống kho dữ liệu cho phép tích hợp nhiều hệ thống ứng dụng. Chúng hỗ trợ xử lý dữ liệu bằng cách cung cấp một nền tảng vững chắc gồm dữ liệu lịch sử, hợp nhất để phân tích.
Kho dữ liệu là một bản lưu dữ liệu nhất quán về mặt ngữ nghĩa, xử lý như một quá trình thực thi vật lý của mô hình dữ liệu hỗ trợ quyết định. Nó lưu dữ liệu mà một doanh nghiệp cần để tạo ra các quyết định chiến lược. Kho dữ liệu được xem như một kiến trúc, được xây dựng bằng cách tích hợp các bản ghi từ một số nguồn không đồng nhất để cung cấp các truy vấn có cấu trúc và đặc biệt, tài liệu phân tích và ra quyết định.
Việc xây dựng một kho dữ liệu cần làm sạch dữ liệu, tích hợp dữ liệu và hợp nhất dữ liệu. Việc sử dụng kho dữ liệu đòi hỏi một bộ công nghệ hỗ trợ quyết định. Điều này cho phép các “nhân viên tri thức” như nhà quản lý, nhà phân tích và giám đốc điều hành cần kho để có được cái nhìn tổng quan về dữ liệu một cách nhanh chóng và thuận tiện, đồng thời đưa ra các quyết định đúng đắn phụ thuộc vào dữ liệu trong kho.
Một số tổ chức sử dụng dữ liệu này để cung cấp các hoạt động ra quyết định kinh doanh, bao gồm
-
Nó có thể nâng cao sự tập trung của người dùng, liên quan đến việc phân tích các kiểu mua của người dùng bao gồm sở thích mua, thời gian mua, chu kỳ ngân sách và nhu cầu chi tiêu.
-
Nó có thể được sử dụng để định vị lại sản phẩm và xử lý danh mục sản phẩm bằng cách so sánh việc thực hiện doanh số bán hàng theo quý, theo năm và theo vùng địa lý để tinh chỉnh phương pháp sản xuất.
-
Nó có thể là phân tích hoạt động và tìm kiếm nguồn lợi nhuận.
-
Nó có thể là quản lý các mối quan hệ với khách hàng, thực hiện các chỉnh sửa về môi trường và quản lý chi phí tài sản của công ty.
Kho dữ liệu có lợi trên quan điểm tích hợp cơ sở dữ liệu không đồng nhất. Các tổ chức thường thu thập một số loại dữ liệu và hỗ trợ cơ sở dữ liệu lớn từ nhiều nguồn dữ liệu không đồng nhất, tự trị và phân tán.
Việc kết hợp những dữ liệu như vậy và hỗ trợ truy cập dễ dàng và hiệu quả là điều vô cùng mong muốn, nhưng đầy thách thức. Nhiều nỗ lực đã được sử dụng trong thị trường cơ sở dữ liệu và cộng đồng nghiên cứu để đạt được mục tiêu này.
Phương pháp cơ sở dữ liệu truyền thống để tích hợp cơ sở dữ liệu không đồng nhất là xây dựng trình bao bọc và tích hợp (hoặc trình trung gian) trên nhiều cơ sở dữ liệu không đồng nhất. Khi một truy vấn được đặt đến một trang web của người dùng, một từ điển siêu dữ liệu có thể được sử dụng để diễn giải truy vấn thành các truy vấn thích hợp cho các trang web không đồng nhất duy nhất được bao gồm.
Các truy vấn này được ánh xạ và chia sẻ cho các bộ xử lý truy vấn cục bộ. Các kết quả được khôi phục từ nhiều trang web được thống nhất thành một bộ câu trả lời toàn cầu. Phương pháp theo hướng truy vấn này cần thủ tục tích hợp và lọc dữ liệu phức tạp, đồng thời cạnh tranh với các site cục bộ để xử lý tài nguyên. Nó không hiệu quả và có khả năng tốn kém đối với các truy vấn thường xuyên, đặc biệt là các truy vấn cần tổng hợp.