Computer >> Máy Tính >  >> Lập trình >> Lập trình

Kiến trúc Kho Dữ liệu Ba tầng là gì?

Kho dữ liệu thường có kiến ​​trúc ba cấp (bậc) liên quan đến -

  • Tầng dưới cùng là một máy chủ cơ sở dữ liệu kho tương đối luôn luôn là một hệ thống cơ sở dữ liệu quan hệ. Các công cụ và tiện ích back-end được sử dụng để cung cấp hồ sơ vào tầng dưới cùng từ cơ sở dữ liệu hoạt động hoặc các nguồn bên ngoài khác (bao gồm cả dữ liệu hồ sơ người dùng do các chuyên gia tư vấn bên ngoài hỗ trợ).

Các công cụ và tiện ích này thực hiện trích xuất, làm sạch và chuyển đổi dữ liệu (ví dụ:để hợp nhất dữ liệu giống nhau từ nhiều nguồn thành một định dạng thống nhất), đồng thời tải và làm mới các chức năng để cập nhật kho dữ liệu. Dữ liệu được trích xuất bằng cách sử dụng các giao diện chương trình ứng dụng được gọi là các cổng.

Một cổng được hỗ trợ bởi DBMS bên dưới và cho phép các chương trình khách tạo mã SQL để được thực thi tại một máy chủ. Ví dụ về các cổng liên quan đến ODBC (Kết nối cơ sở dữ liệu mở) và OLEDB (Liên kết mở và nhúng cho cơ sở dữ liệu) của Microsoft và JDBC (Kết nối cơ sở dữ liệu Java). Tầng này cũng bao gồm một kho lưu trữ siêu dữ liệu, lưu dữ liệu về kho dữ liệu và nội dung của nó.

  • Tầng giữa là một máy chủ OLAP thường được thực thi bằng cách sử dụng mô hình OLAP quan hệ (ROLAP), nghĩa là, một DBMS quan hệ mở rộng ánh xạ các hoạt động trên dữ liệu đa chiều với các hoạt động quan hệ chuẩn hoặc mô hình OLAP (MOLAP) đa chiều, cụ thể là, một đặc biệt- máy chủ mục đích trực tiếp thực hiện các hoạt động và dữ liệu đa chiều.

  • Cấp trên cùng là một lớp khách hàng front-end. Nó bao gồm các công cụ truy vấn và báo cáo, công cụ phân tích và / hoặc công cụ khai thác dữ liệu (ví dụ:phân tích xu hướng, dự đoán, v.v.).

Theo quan điểm kiến ​​trúc, có ba mô hình kho dữ liệu như kho doanh nghiệp, kho dữ liệu và kho ảo.

Kho doanh nghiệp - Kho doanh nghiệp thu thập tất cả dữ liệu về các đối tượng trong toàn bộ tổ chức. Nó hỗ trợ tích hợp dữ liệu trong toàn công ty, thường từ một hoặc nhiều hệ thống hoạt động hoặc nhà cung cấp dữ liệu bên ngoài và có phạm vi chức năng chéo.

Nó thường bao gồm dữ liệu chi tiết và dữ liệu tóm tắt và có thể có kích thước từ vài gigabyte đến hàng nghìn gigabyte, terabyte, v.v. Kho dữ liệu doanh nghiệp có thể được thực hiện trên máy tính lớn truyền thống, siêu máy chủ hoặc nền tảng kiến ​​trúc song song. Nó cần mô hình kinh doanh rộng rãi và có thể mất nhiều năm để thiết kế và xây dựng.

Datamart - Data mart bao gồm một tập hợp con dữ liệu toàn công ty có giá trị đối với một nhóm người dùng nhất định. Phạm vi được giới hạn cho các đối tượng được chọn chắc chắn. Ví dụ:siêu thị dữ liệu tiếp thị có thể giới hạn các đối tượng của nó với người dùng, mặt hàng và doanh số bán hàng. Dữ liệu được đưa vào data mart có xu hướng được tóm tắt.

Kho ảo - Kho ảo là tập hợp các khung nhìn trên cơ sở dữ liệu hoạt động. Để xử lý truy vấn hiệu quả, chỉ có thể thực hiện một số dạng xem tóm tắt khả thi. Kho ảo chỉ đơn giản là để xây dựng nhưng dung lượng dư thừa cần thiết trên các máy chủ cơ sở dữ liệu đang hoạt động.