Computer >> Máy Tính >  >> Lập trình >> Lập trình

Thiết kế của kho dữ liệu hướng chất lượng là gì?

Kho dữ liệu xác định cơ sở dữ liệu được duy trì độc lập với cơ sở dữ liệu hoạt động của tổ chức. Hệ thống kho dữ liệu cho phép tích hợp một số hệ thống ứng dụng. Chúng hỗ trợ xử lý dữ liệu bằng cách hỗ trợ một nền tảng vững chắc gồm các bản ghi lịch sử, hợp nhất để phân tích.

Kho dữ liệu có thể được xem như một tập hợp các khung nhìn cụ thể hóa được biểu diễn qua các quan hệ cơ sở từ xa. Khi một truy vấn là chính thức, nó sẽ được tính toán cục bộ, sử dụng các khung nhìn cụ thể hóa, mà không cần truy cập các nguồn dữ liệu ban đầu.

Kho dữ liệu là một thực thể hoạt động có nguồn gốc liên tục theo thời gian. Khi thời gian trôi qua, các truy vấn mới bắt buộc phải được họ trả lời. Có thể trả lời nhiều câu hỏi khác nhau bằng cách sử dụng các chế độ xem cụ thể hóa. Nói chung, mặc dù các chế độ xem mới cần phải được chèn vào kho dữ liệu.

Sau khi cơ sở hạ tầng xử lý giao dịch trực tuyến (OLTP) cơ bản được áp dụng trong một số tổ chức, không phải nhỏ nhất thông qua các công cụ hoạch định nguồn lực doanh nghiệp được tiêu chuẩn hóa bao gồm SAP / R3, mục tiêu quan tâm hiện đang được mở rộng theo ba hướng tối thiểu -

  • Nhiều nguồn dữ liệu đa phương tiện hơn trong và ngoài tổ chức.

  • Nhiều khách hàng hơn với sở thích và hồ sơ năng lực đa dạng và các thông số tình huống.

  • Việc chuyển đổi dữ liệu trải nghiệm khổng lồ được tạo ra bởi quá trình xử lý giao dịch thành kiến ​​thức áp dụng cho thông tin và hành động của tổ chức.

Một loạt các kiến ​​trúc hậu cần luồng dữ liệu đang được đề xuất dưới các nhãn bao gồm quản lý chuỗi cung ứng và thương mại điện tử giữa doanh nghiệp với doanh nghiệp. Trong các kiến ​​trúc như vậy, cơ sở dữ liệu có thể được coi là kho lưu trữ dữ liệu trung gian ngắn hạn và trung hạn trong khi kho dữ liệu phục vụ cho bộ nhớ dài hạn, tạo tri thức và quản lý.

Hệ thống kho dữ liệu bao gồm cơ sở dữ liệu (cơ sở dữ liệu nguồn, chế độ xem cụ thể hóa trong kho dữ liệu), tác nhân vận chuyển dữ liệu chuyển các bản ghi từ cơ sở dữ liệu này sang cơ sở dữ liệu khác và một kho lưu trữ siêu dữ liệu về hệ thống và việc mở rộng hệ thống.

Trong kiến ​​trúc này, các nguồn dữ liệu không đồng nhất đầu tiên được tạo ra có thể áp dụng theo một phương pháp thống nhất thông qua cơ chế trích xuất được gọi là trình bao bọc, sau đó người hòa giải đảm nhận các dịch vụ tích hợp dữ liệu và giải quyết xung đột. Sự tách biệt giữa trình bao bọc và trình trung gian là một quyết định thiết kế được cân nhắc, phản ánh sự tách biệt giữa trình bao bọc dịch vụ và người môi giới yêu cầu trong các hệ thống phần mềm trung gian bao gồm CORBA.

Các bản ghi tích hợp và tiêu chuẩn hóa kết quả được lưu dưới dạng các dạng xem cụ thể hóa trong kho dữ liệu. Các quan điểm cơ sở này thường được tổng hợp một chút. Nó có thể tùy chỉnh chúng cho một số người dùng phân tích, các data mart với nhiều thông tin tổng hợp hơn về các lĩnh vực quan tâm cụ thể được xây dựng dưới dạng bộ nhớ đệm cấp hai, sau đó được thâm nhập bởi các công cụ phân tích dữ liệu, từ các phương tiện truy vấn thông qua các công cụ bảng tính đến các hệ thống khai thác dữ liệu chính thức.