Hồi quy
Hồi quy xác định một loại phương pháp học máy được giám sát có thể được sử dụng để dự báo bất kỳ thuộc tính có giá trị liên tục nào. Hồi quy cung cấp cho một số tổ chức kinh doanh khám phá các liên kết biến mục tiêu và biến dự báo. Đây là một công cụ cần thiết để khám phá dữ liệu có thể được sử dụng cho dự báo tiền tệ và mô hình chuỗi thời gian.
Dữ liệu có thể được làm mịn bằng cách điều chỉnh dữ liệu với một hàm, chẳng hạn như với hồi quy. Hồi quy tuyến tính bao gồm việc khám phá dòng "tốt nhất" để phù hợp với hai thuộc tính (hoặc biến), do đó một thuộc tính có thể được sử dụng để dự đoán thuộc tính kia. Một số hồi quy tuyến tính là một bước tiến của hồi quy tuyến tính, trong đó các thuộc tính cao hơn được bao gồm và dữ liệu phù hợp với không gian đa chiều.
Trong hồi quy tuyến tính, dữ liệu được mô hình hóa để vừa với một đường thẳng. Ví dụ, một biến ngẫu nhiên, y (được gọi là biến đáp ứng), có thể được mô hình hóa dưới dạng hàm tuyến tính của một biến ngẫu nhiên khác, x (được gọi là biến dự báo), với phương trình y =wx + b, trong đó phương sai của y được coi là không đổi.
Các vấn đề hồi quy được quản lý bằng việc tính toán giá trị đầu ra được đặt trên các giá trị đầu vào. Khi được sử dụng để phân loại, các giá trị đầu vào là các giá trị từ cơ sở dữ liệu và các giá trị đầu ra đại diện cho các lớp. Hồi quy có thể được sử dụng để khám phá các vấn đề phân loại, nhưng nó có thể được sử dụng cho nhiều ứng dụng như dự báo. Cấu trúc cơ bản của hồi quy là hồi quy tuyến tính đơn giản chỉ chứa một dự báo và một dự đoán.
Phân loại
Phân loại là thủ tục khám phá một mô hình đại diện và phân biệt các lớp hoặc khái niệm dữ liệu, nhằm mục đích có thể sử dụng mô hình để dự đoán lớp của các đối tượng có nhãn lớp là ẩn danh. Mô hình dẫn xuất dựa trên việc phân tích một nhóm các bản ghi huấn luyện (tức là các đối tượng dữ liệu có nhãn lớp quen thuộc).
Mỗi tuple được coi là thuộc về một lớp được xác định trước, được xác định bởi một trong các thuộc tính, được gọi là thuộc tính nhãn lớp. Trong cấu trúc phân loại, các bộ dữ liệu được biểu diễn dưới dạng mẫu, ví dụ hoặc đối tượng. Các bộ dữ liệu được phân tích để tạo mô hình chung tạo thành tập dữ liệu đào tạo. Các bộ giá trị riêng lẻ tạo nên tập huấn luyện được biểu diễn dưới dạng các mẫu huấn luyện và được chọn từ tập hợp mẫu.
Vì nhãn lớp của mọi mẫu đào tạo được cung cấp nên quá trình này cũng được định nghĩa là học có giám sát. Trong học tập không có giám sát, trong đó nhãn lớp của các mẫu đào tạo không được xác định và không thể biết trước các lớp khác nhau để hiểu.