Computer >> Máy Tính >  >> Lập trình >> Lập trình

Phân loại và Dự đoán là gì?

Phân loại

Phân loại là một phương pháp khai thác dữ liệu được sử dụng để dự đoán thành viên nhóm cho các cá thể dữ liệu. Trong phân loại, có một biến phân loại mục tiêu, bao gồm cả khung thu nhập. Ví dụ, nó có thể là sự phân chia thành ba loại hoặc các loại như thu nhập cao, thu nhập trung bình và thu nhập thấp.

Mô hình khai thác dữ liệu phân tích một tập hợp các bản ghi khổng lồ, mỗi bản ghi bao gồm dữ liệu về biến mục tiêu và một tập hợp các biến đầu vào hoặc biến dự báo. Ví dụ:hãy xem xét đoạn trích từ tập dữ liệu có trong bảng.

Trích từ Tập dữ liệu để phân loại thu nhập

Chủ đề Tuổi Giới tính Nghề nghiệp Khung Thu nhập
001 47 Nữ Kỹ sư phần mềm Cao
002 28 Nam Chuyên gia tư vấn Trung
003 35 Nam Thất nghiệp Thấp

Giả sử rằng nhà nghiên cứu muốn phân loại mức thu nhập của những người không có trong cơ sở dữ liệu là đủ tùy thuộc vào các đặc điểm khác liên quan đến người đó, bao gồm tuổi, giới tính và nghề nghiệp. Nhiệm vụ này là một nhiệm vụ phân loại. Nó rất phù hợp với các phương pháp và kỹ thuật khai thác dữ liệu.

Thuật toán sẽ tiến hành gần như như sau. Trước tiên, hãy xem xét tập dữ liệu bao gồm cả biến dự báo và biến mục tiêu (đã phân loại trước đó), khung thu nhập.

Trong phương pháp này, thuật toán hiểu tổ hợp biến nào có liên quan đến khung thu nhập nào. Ví dụ, phụ nữ lớn tuổi có thể thuộc nhóm thu nhập cao. Tập dữ liệu này được gọi là tập huấn luyện.

Ví dụ về các nhiệm vụ phân loại trong kinh doanh và nghiên cứu liên quan đến -

  • Nó có thể quyết định xem một giao dịch thẻ tín dụng cụ thể có gian lận hay không.

  • Nó có thể là định vị một ứng cử viên mới vào một đường dẫn cụ thể về các yêu cầu nhất định.

  • Nó có thể được sử dụng để kiểm tra xem phần mềm thế chấp là rủi ro tín dụng tốt hay xấu.

  • Nó có thể đang điều tra xem một căn bệnh cụ thể có phải là bệnh hiển thị hay không.

  • Nó có thể được xác định xem liệu một số hành vi tài chính hoặc cá nhân có biểu hiện một mối đe dọa khủng bố có thể xảy ra hay không.

Dự đoán

Dự đoán cũng giống như phân loại, ngoại trừ dự đoán, kết quả sẽ bị mô tả sai trong tương lai.

Ví dụ về các nhiệm vụ dự đoán trong kinh doanh và nghiên cứu liên quan đến -

  • Nó có thể dự đoán giá trị của một cổ phiếu trong ba tháng tới.

  • Có thể dự đoán tỷ lệ tử vong do giao thông sẽ tăng lên trong năm tới nếu giới hạn tốc độ được nâng lên.

  • Có thể dự đoán đội chiến thắng trong Giải bóng chày thế giới mùa thu năm nay, tùy thuộc vào sự giống nhau về số liệu thống kê của đội.

  • Nó có thể dự đoán liệu một phân tử cụ thể trong việc khám phá thuốc có bắt đầu tạo ra một loại thuốc mới có lợi cho một tổ chức dược phẩm hay không.