Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các chức năng của khai thác dữ liệu là gì?

Các chức năng khai phá dữ liệu được sử dụng để đại diện cho loại mẫu phải được phát hiện trong các tác vụ khai thác dữ liệu. Nhìn chung, các tác vụ khai thác dữ liệu có thể được phân thành hai loại bao gồm mô tả và dự đoán. Các nhiệm vụ khai thác mô tả xác định các đặc điểm chung của dữ liệu trong cơ sở dữ liệu và các tác vụ khai thác dự đoán thực hiện suy luận về thông tin hiện tại để phát triển các dự đoán.

Có các chức năng khai thác dữ liệu khác nhau như sau -

  • Đặc điểm dữ liệu - Là sự tổng hợp các đặc điểm chung của một lớp dữ liệu đối tượng. Dữ liệu tương ứng với lớp do người dùng chỉ định thường được thu thập bởi một truy vấn cơ sở dữ liệu. Kết quả của việc mô tả đặc tính dữ liệu có thể được trình bày dưới nhiều dạng.

  • Phân biệt dữ liệu - Là sự so sánh các đặc điểm chung của các đối tượng dữ liệu lớp đích với các đặc điểm chung của các đối tượng từ một hoặc một tập hợp các lớp tương phản. Người dùng có thể đại diện cho các lớp đích và các lớp tương phản và các đối tượng dữ liệu tương đương được tìm nạp thông qua các truy vấn cơ sở dữ liệu.

  • Phân tích liên kết - Nó phân tích tập hợp các mục thường xảy ra cùng nhau trong một tập dữ liệu giao dịch. Có hai tham số được sử dụng để xác định các quy tắc kết hợp -

    • Nó cung cấp thông tin xác định tập hợp mục chung trong cơ sở dữ liệu.

    • Độ tin cậy là xác suất có điều kiện mà một mặt hàng xuất hiện trong giao dịch khi một mặt hàng khác xảy ra.

  • Phân loại - Phân loại là thủ tục khám phá một mô hình đại diện và phân biệt các lớp hoặc khái niệm dữ liệu, với mục tiêu là có thể sử dụng mô hình để dự đoán lớp của các đối tượng mà nhãn lớp là ẩn danh. Mô hình dẫn xuất được thiết lập dựa trên việc phân tích một tập dữ liệu huấn luyện (tức là các đối tượng dữ liệu có nhãn lớp là chung).

  • Dự đoán - Nó xác định dự đoán một số giá trị dữ liệu không có sẵn hoặc các xu hướng đang chờ xử lý. Một đối tượng có thể được dự đoán dựa trên các giá trị thuộc tính của đối tượng và các giá trị thuộc tính của các lớp. Nó có thể là dự đoán về các giá trị số bị thiếu hoặc xu hướng tăng / giảm trong thông tin liên quan đến thời gian.

  • Phân nhóm - Nó tương tự như phân loại nhưng các lớp không được xác định trước. Các lớp được biểu diễn bằng các thuộc tính dữ liệu. Đó là học tập không có giám sát. Các đối tượng được phân cụm hoặc nhóm lại, phụ thuộc vào nguyên tắc tối đa hóa độ tương đồng nội bộ và giảm thiểu độ tương đồng nội bộ.

  • Phân tích ngoại lệ - Các phần tử ngoại lai là các phần tử dữ liệu không thể được nhóm lại trong một lớp hoặc cụm nhất định. Đây là các đối tượng dữ liệu có nhiều hành vi từ hành vi chung của các đối tượng dữ liệu khác. Việc phân tích loại dữ liệu này có thể là điều cần thiết để khai thác kiến ​​thức.

  • Phân tích sự phát triển - Nó xác định xu hướng cho các đối tượng có hành vi thay đổi theo thời gian.