Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các tiêu chí để lựa chọn các nguồn dữ liệu là gì?

Có nhiều tiêu chí khác nhau để chọn nguồn dữ liệu như sau -

Khả năng truy cập dữ liệu - Nếu hai nguồn cấp dữ liệu có thể tồn tại, một nguồn được lưu trữ trong các tệp nhị phân được duy trì bởi một bộ chương trình được viết trước khi thành viên nhóm dự án trẻ nhất được sinh ra và nguồn còn lại từ hệ thống đọc tài liệu nhị phân và hỗ trợ nhiều xử lý hơn, thì quyết định là hiển nhiên.

Độ chính xác của dữ liệu - Khi dữ liệu được truyền từ hệ thống này sang hệ thống khác, nhiều sửa đổi được thực hiện. Đôi khi các phần tử dữ liệu từ các hệ thống khác được thêm vào và đôi khi các phần tử hiện có được xử lý để tạo ra các phần tử mới và các phần tử khác bị loại bỏ.

Mỗi hệ thống thực hiện tốt chức năng của nó. Tuy nhiên, có thể khó hoặc không thể nhận ra dữ liệu gốc. Trong một số trường hợp, dữ liệu không còn đại diện cho những gì doanh nghiệp muốn phân tích. Nếu bạn cung cấp dữ liệu từ các hệ thống hạ nguồn này, người dùng có thể đặt câu hỏi về độ chính xác.

Lập lịch dự án - Trong nhiều tổ chức, dự án kho dữ liệu bắt đầu như một phần của quá trình viết lại hệ thống OLTP hiện có. Khi dự án phát triển hệ thống mới bắt đầu triển khai, có trường hợp người dùng doanh nghiệp tin chắc về giá trị của kho dữ liệu bắt đầu khăng khăng rằng kho dữ liệu phải được triển khai sớm hơn là muộn.

Để cung cấp dữ liệu lịch sử, bạn cần đưa dữ liệu từ hệ thống hiện có vào kho dữ liệu của mình. Nếu quá trình viết lại hệ thống cũ được duy trì, kho dữ liệu có thể tiếp tục sử dụng hệ thống hiện tại. Khi hệ thống mới được phát hành để sản xuất, các nguồn cấp dữ liệu có thể được chuyển sang nó. Trong nhiều trường hợp, có thể cung cấp kho dữ liệu trước khi hệ điều hành mới được hoàn thiện.

Một số thông tin về chiều thường đi kèm với dữ liệu giao dịch hoặc dữ liệu thực tế, nhưng nó thường tối thiểu và thường chỉ ở dạng mã. Các thuộc tính bổ sung mà người dùng có thể muốn và yêu cầu được cung cấp từ một số hệ thống hoặc tệp tổng thể chung.

Trong nhiều trường hợp, có thể có nhiều tệp chính, đặc biệt là đối với thứ nguyên khách hàng. Thường có các tệp riêng biệt được sử dụng trong một tổ chức. Bán hàng, Tiếp thị và Tài chính có thể có các tệp khách hàng chính của họ.

Có hai vấn đề khó khăn đầu tiên là khách hàng được bao gồm trong các tệp này có thể khác nhau và các thuộc tính của mỗi khách hàng có thể khác nhau. Thứ hai, thông tin chung có thể không khớp. Nếu nó có thể có thời gian và tiền bạc không giới hạn, nó có thể lấy dữ liệu phong phú từ tất cả các nguồn và sau đó kết hợp nó thành một cái nhìn toàn diện về khách hàng.

Trong hầu hết các trường hợp, không có đủ thời gian hoặc tiền bạc để làm việc đó cùng một lúc. Trong những trường hợp này, người dùng nên ưu tiên thông tin và bạn nên bắt đầu với những gì bạn có thể và mở rộng trong tương lai.