Computer >> Máy Tính >  >> Lập trình >> Lập trình

Loại dữ liệu nào có thể được khai thác?

Khai phá dữ liệu xác định việc trích xuất hoặc khai thác kiến ​​thức từ một lượng lớn dữ liệu. Khai thác dữ liệu thường được sử dụng ở những nơi mà một lượng lớn dữ liệu được lưu và xử lý. Ví dụ:hệ thống ngân hàng sử dụng khai thác dữ liệu để tiết kiệm một lượng lớn dữ liệu được xử lý liên tục.

Trong Khai phá dữ liệu, các mẫu dữ liệu ẩn được xem xét theo nhiều danh mục thành một phần dữ liệu hữu ích. Dữ liệu này được tập hợp trong một khu vực bao gồm các kho dữ liệu để phân tích nó và các thuật toán khai thác dữ liệu được thực hiện. Dữ liệu này tạo điều kiện thuận lợi trong việc đưa ra các quyết định hiệu quả nhằm giảm giá trị và tăng doanh thu.

Có nhiều loại ứng dụng khai thác dữ liệu khác nhau được sử dụng cho dữ liệu như sau -

  • Cơ sở dữ liệu quan hệ - Hệ cơ sở dữ liệu còn được gọi là hệ quản trị cơ sở dữ liệu. Nó bao gồm một tập hợp dữ liệu có liên quan với nhau, được gọi là cơ sở dữ liệu và một tập hợp các chương trình phần mềm để xử lý và truy cập dữ liệu.

Cơ sở dữ liệu quan hệ là một tập hợp các bảng, mỗi bảng được cấp một tên duy nhất. Mỗi bảng bao gồm một tập hợp các thuộc tính (cột hoặc trường) và thường lưu trữ một tập hợp khổng lồ các bộ giá trị (bản ghi hoặc hàng). Mỗi bộ trong bảng quan hệ xác định một đối tượng được xác định bằng một khóa duy nhất và được đại diện bởi một tập hợp các giá trị thuộc tính. Mô hình dữ liệu ngữ nghĩa bao gồm mô hình dữ liệu mối quan hệ thực thể (ER) thường được xây dựng cho cơ sở dữ liệu quan hệ. Mô hình dữ liệu ER xác định cơ sở dữ liệu là một tập hợp các thực thể và các mối quan hệ của chúng.

  • Cơ sở dữ liệu giao dịch - Cơ sở dữ liệu giao dịch bao gồm một tệp trong đó mỗi bản ghi xác định một giao dịch. Một giao dịch thường chứa một số nhận dạng giao dịch duy nhất (trans ID) và danh sách các mặt hàng tạo nên giao dịch (chẳng hạn như các mặt hàng được mua trong cửa hàng).

Cơ sở dữ liệu giao dịch có thể có các bảng bổ sung liên quan đến nó, bao gồm các dữ liệu khác liên quan đến việc bán hàng, bao gồm ngày giao dịch, số ID khách hàng, số ID của nhân viên bán hàng và của chi nhánh nơi giao dịch xuất hiện, v.v.

  • Cơ sở dữ liệu quan hệ đối tượng - Cơ sở dữ liệu quan hệ đối tượng được tập hợp dựa trên mô hình dữ liệu quan hệ đối tượng. Mô hình này tiếp tục mô hình quan hệ bằng cách hỗ trợ kiểu dữ liệu phong phú để quản lý các đối tượng phức tạp và hướng đối tượng.

  • Cơ sở dữ liệu tạm thời - Cơ sở dữ liệu tạm thời thường lưu trữ dữ liệu quan hệ có chứa các thuộc tính liên quan đến thời gian. Các thuộc tính này có thể bao gồm nhiều dấu thời gian, mỗi dấu thời gian có một số ngữ nghĩa.

  • Cơ sở dữ liệu trình tự - Một cơ sở dữ liệu trình tự lưu trữ các chuỗi sự kiện có thứ tự, có hoặc không có ý tưởng thực tế về thời gian. Ví dụ:trình tự mua sắm của khách hàng, luồng nhấp chuột trên web và trình tự sinh học.

  • Cơ sở dữ liệu chuỗi thời gian - Cơ sở dữ liệu chuỗi thời gian lưu trữ các chuỗi giá trị hoặc sự kiện được truy cập qua các phép đo thời gian lặp lại (ví dụ:hàng giờ, hàng ngày, hàng tuần). Một ví dụ bao gồm dữ liệu được thu thập từ sàn giao dịch chứng khoán, kiểm soát chứng khoán và đo lường các hiện tượng tự nhiên (như nhiệt độ và gió).