Computer >> Máy Tính >  >> Lập trình >> Lập trình

Hồi quy là gì?


Hồi quy xác định loại phương pháp tiếp cận máy học được giám sát có thể được sử dụng để dự báo bất kỳ thuộc tính có giá trị liên tục nào. Hồi quy cung cấp cho một số tổ chức kinh doanh khám phá các liên kết biến mục tiêu và biến dự báo. Đây là một công cụ cần thiết để khám phá dữ liệu có thể được sử dụng cho dự báo tiền tệ và mô hình chuỗi thời gian.

Dữ liệu có thể được làm mịn bằng cách điều chỉnh dữ liệu với một hàm, chẳng hạn như với hồi quy. Hồi quy tuyến tính bao gồm việc khám phá dòng "tốt nhất" để phù hợp với hai thuộc tính (hoặc biến), do đó, một thuộc tính có thể được sử dụng để dự đoán thuộc tính kia. Một số hồi quy tuyến tính là một bước tiến của hồi quy tuyến tính, trong đó các thuộc tính cao hơn được bao gồm và dữ liệu phù hợp với không gian đa chiều.

Trong hồi quy tuyến tính, dữ liệu được mô hình hóa để vừa với một đường thẳng. Ví dụ, một biến ngẫu nhiên, y (được gọi là biến đáp ứng), có thể được mô hình hóa dưới dạng hàm tuyến tính của một biến ngẫu nhiên khác, x (được gọi là biến dự báo), với phương trình y =wx + b, trong đó phương sai của y được coi là không đổi.

Các vấn đề hồi quy được quản lý bằng việc tính toán giá trị đầu ra được đặt trên các giá trị đầu vào. Khi được sử dụng để phân loại, các giá trị đầu vào là các giá trị từ cơ sở dữ liệu và các giá trị đầu ra đại diện cho các lớp. Hồi quy có thể được sử dụng để khám phá các vấn đề phân loại, nhưng nó có thể được sử dụng cho nhiều ứng dụng như dự báo. Cấu trúc cơ bản của hồi quy là hồi quy tuyến tính đơn giản chỉ chứa một dự báo và một dự đoán.

Hồi quy có thể được sử dụng để thực hiện phân loại bằng hai phương pháp như sau -

  • Bộ phận - Dữ liệu được chia thành các vùng nằm trên lớp.

  • Dự đoán - Các công thức được tạo ra để dự đoán giá trị của lớp đầu ra.

Các phương pháp này được sử dụng để dự đoán giá trị của một biến phản hồi (phụ thuộc) từ một hoặc nhiều biến dự báo (độc lập) trong đó các biến là số nguyên. Có nhiều dạng hồi quy, chẳng hạn như tuyến tính, nhiều, có trọng số, đa thức, không tham số và mạnh mẽ (các kỹ thuật mạnh mẽ rất hữu ích khi lỗi không cần điều kiện bình thường hoặc khi dữ liệu chứa các giá trị ngoại lệ đáng kể).

Hồi quy có thể dự đoán một số tập dữ liệu phụ thuộc, được xác định trong biểu thức của các biến riêng biệt và xu hướng có thể truy cập được trong một khoảng thời gian xác định. Hồi quy hỗ trợ một phương pháp tốt để dự đoán các biến, nhưng có những hạn chế và giả định cụ thể như tính độc lập của các biến, phân phối chuẩn vốn có của các biến.

Mỗi lá cây hồi quy lưu trữ một dự đoán có giá trị liên tục, là chi phí trung bình của thuộc tính được dự đoán cho các tập huấn luyện bao gồm lá đó. Ngược lại, trong cây mô hình, mỗi lá có xu hướng là một mô hình hồi quy và một phương trình liên tục đa biến cho thuộc tính dự đoán. Cây hồi quy và mô hình ảnh hưởng đến hiệu quả hơn hồi quy tuyến tính khi dữ liệu không được đại diện tốt bằng mô hình tuyến tính dễ dàng.