Truyền dữ liệu là việc phân bổ dữ liệu từ một hoặc nhiều kho dữ liệu nguồn tới một cơ sở dữ liệu truy cập cục bộ khác, theo các quy tắc truyền dữ liệu. Kho dữ liệu được yêu cầu để quản lý hàng loạt dữ liệu lớn mỗi ngày. Kho dữ liệu có thể bắt đầu với một vài thông tin và bắt đầu tăng lên từng ngày bằng cách liên tục chia sẻ và nhận từ nhiều nguồn dữ liệu.
Khi việc chia sẻ dữ liệu ngày càng tiến bộ, việc quản lý kho dữ liệu trở thành một vấn đề lớn. Quản lý cơ sở dữ liệu là cần thiết để quản lý thông tin công ty hiệu quả hơn và trong nhiều tập hợp con, sắp xếp và khung thời gian. Các tài nguyên dữ liệu này bắt buộc phải được cập nhật liên tục và quá trình cập nhật bao gồm việc di chuyển khối lượng lớn hồ sơ từ hệ thống này sang hệ thống khác và qua lại và trở lại hệ thống thông minh kinh doanh.
Việc di chuyển dữ liệu với khối lượng lớn được thực hiện theo lô trong một khoảng thời gian ngắn là điều quen thuộc mà không ảnh hưởng đến hiệu suất hoặc tính khả dụng của phần mềm vận hành hoặc dữ liệu từ kho. Khối lượng thông tin cần thay đổi càng lớn thì thủ tục càng trở nên khó khăn và phức tạp. Do đó, quản lý kho dữ liệu có trách nhiệm tìm ra các phương tiện chuyển đổi thông tin hàng loạt nhanh hơn và chỉ nhận dạng và chuyển dữ liệu đã thay đổi do lần cập nhật kho dữ liệu gần đây nhất.
Có một số phương pháp được phát triển để giải quyết các vấn đề liên quan đến chia sẻ dữ liệu thông qua truyền dữ liệu như sau -
Trích xuất hàng loạt - Trong kỹ thuật truyền dữ liệu này, các công cụ quản lý sao chép hoặc các tiện ích trống đang được sử dụng để lấy tất cả hoặc một tập con của cơ sở dữ liệu quan hệ hoạt động. Nói chung, thông tin được trích xuất sau đó được chuyển đến cơ sở dữ liệu tiêu điểm bằng cách sử dụng giao thức truyền tệp (FTP) bất kỳ kỹ thuật tương tự nào khác. Dữ liệu đã được trích xuất có thể được thay đổi thành định dạng được sử dụng bởi đối tượng trên máy chủ lưu trữ hoặc máy chủ đối tượng.
So sánh tệp - Kỹ thuật này là một sự đổi mới của phương pháp di chuyển hàng loạt. Giai đoạn này so sánh dữ liệu hoạt động được trích xuất gần đây với phiên bản trước đây. Sau đó, một tập hợp dữ liệu thay đổi gia tăng được tạo ra. Việc xử lý các thay đổi gia tăng giống như các phương pháp được sử dụng trong trích xuất hàng loạt ngoại trừ việc các thay đổi gia tăng được sử dụng như các bản cập nhật cho máy chủ đối tượng trong giai đoạn đã lên lịch. Phương pháp này được khuyến nghị cho các tài liệu nhỏ hơn chỉ có một số thay đổi về dữ liệu.
Thay đổi truyền dữ liệu - Kỹ thuật này nắm bắt và dữ liệu các thay đổi đối với tệp như một yếu tố của quá trình thay đổi phần mềm. Một số kỹ thuật có thể được sử dụng để thực thi Truyền dữ liệu thay đổi bao gồm các trình kích hoạt, thoát nhật ký, xử lý sau nhật ký hoặc các phần mở rộng DBMS. Một tệp các thay đổi gia tăng được tạo để bao gồm các thay đổi đã nắm bắt được.
Sau khi kết thúc giao dịch nguồn, dữ liệu thay đổi có thể được chuyển đổi và thay đổi thành cơ sở dữ liệu đối tượng. Kiểu truyền dữ liệu này đôi khi được gọi là truyền gần thời gian thực hoặc truyền liên tục và được sử dụng để giữ cho cơ sở dữ liệu đối tượng được đồng bộ hóa trong một khoảng thời gian rất ngắn của hệ thống nguồn.