Computer >> Máy Tính >  >> Lập trình >> Lập trình

Thiết kế kho dữ liệu là gì?

Kho dữ liệu là một cách tiếp cận có thể thu thập và quản lý thông tin từ nhiều nguồn để hỗ trợ doanh nghiệp một cái nhìn sâu sắc về kinh doanh. Một kho dữ liệu được tạo riêng cho các mục tiêu của các quyết định quản lý hỗ trợ.

Kho dữ liệu xác định cơ sở dữ liệu được duy trì tách biệt với cơ sở dữ liệu hoạt động của công ty. Hệ thống kho dữ liệu cho phép tích hợp một số hệ thống ứng dụng. Chúng hỗ trợ xử lý dữ liệu bằng cách hỗ trợ một nền tảng vững chắc gồm các bản ghi lịch sử, hợp nhất để phân tích.

Kho dữ liệu có thể được coi là một nhóm các khung nhìn cụ thể hóa được xác định trên các khu vực cơ sở ở xa. Khi một truy vấn là chính thức, nó sẽ được tính toán cục bộ, sử dụng các khung nhìn cụ thể hóa, mà không cần truy cập các nguồn dữ liệu ban đầu.

Kho dữ liệu là một thực thể hoạt động có nguồn gốc liên tục theo thời gian. Khi thời gian trôi qua, các truy vấn mới bắt buộc phải được họ trả lời. Có thể trả lời nhiều câu hỏi khác nhau bằng cách sử dụng các chế độ xem cụ thể hóa. Nói chung, mặc dù các chế độ xem mới cần phải được chèn vào kho dữ liệu.

Hệ thống kho dữ liệu bao gồm cơ sở dữ liệu (cơ sở dữ liệu nguồn, các khung nhìn cụ thể trong kho dữ liệu), các tác nhân vận chuyển dữ liệu chuyển các bản ghi từ cơ sở dữ liệu này sang cơ sở dữ liệu khác và một kho lưu trữ siêu dữ liệu về hệ thống và việc mở rộng hệ thống.

Có nhiều vấn đề thách thức khác nhau liên quan đến việc xây dựng và ứng dụng các kho dữ liệu không gian. Thách thức đầu tiên là sự thống nhất thông tin không gian từ các nguồn và hệ thống không đồng nhất. Dữ liệu không gian thường được lưu trong một số công ty thị trường và cơ quan chính phủ bằng nhiều định dạng dữ liệu.

Thách thức thứ hai là việc thực hiện xử lý phân tích trực tuyến nhanh chóng và linh hoạt trong các kho dữ liệu không gian. Mô hình giản đồ hình sao là lựa chọn tốt nhất để lập mô hình kho dữ liệu không gian vì nó hỗ trợ cấu trúc kho ngắn gọn và có tổ chức cũng như hỗ trợ các dịch vụ OLAP. Tuy nhiên, trong kho không gian, cả kích thước và thước đo đều có thể bao gồm các yếu tố không gian.

Có bốn chế độ xem khác nhau liên quan đến việc thiết kế kho dữ liệu phải được xem xét, chẳng hạn như chế độ xem từ trên xuống, chế độ xem nguồn dữ liệu, chế độ xem kho dữ liệu và chế độ xem truy vấn kinh doanh.

Chế độ xem từ trên xuống cho phép lựa chọn thông tin liên quan cần thiết cho kho dữ liệu. Dữ liệu này kết nối các yêu cầu kinh doanh hiện tại và tương lai.

Chế độ xem nguồn dữ liệu tiết lộ dữ liệu được hệ thống vận hành thu thập, lưu và xử lý. Dữ liệu này có thể được lập thành văn bản ở nhiều cấp độ chi tiết và chính xác, từ các bảng nguồn dữ liệu đơn lẻ đến các bảng nguồn dữ liệu tích hợp.

Nguồn dữ liệu thường được mô hình hóa bằng các kỹ thuật mô hình hóa dữ liệu truyền thống, chẳng hạn như mô hình mối quan hệ thực thể hoặc các công cụ CASE (kỹ thuật phần mềm hỗ trợ máy tính).

Chế độ xem kho dữ liệu chứa bảng dữ kiện và bảng kích thước. Nó xác định dữ liệu được lưu trong kho dữ liệu, chẳng hạn như tổng số và số đếm được tính toán trước, và thông tin liên quan đến nguồn, ngày và giờ xuất xứ, được thêm vào để hỗ trợ bối cảnh lịch sử.

Cuối cùng, chế độ xem truy vấn kinh doanh là chế độ xem các bản ghi trong kho dữ liệu từ quan điểm của người dùng cuối.