Đóng gói
Đóng bao còn được gọi là tổng hợp bootstrap. Đây là phương pháp học tập kết hợp thường được sử dụng để giảm phương sai trong một tập dữ liệu ồn ào. Khi đóng gói, một mẫu dữ liệu ngẫu nhiên trong tập huấn luyện được chọn thay thế nghĩa là các điểm dữ liệu đơn lẻ có thể được chọn nhiều lần.
Sau khi một số mẫu dữ liệu được tạo, các mô hình yếu này được huấn luyện riêng biệt và phụ thuộc vào yếu tố của hồi quy nhiệm vụ hoặc phân loại. Ví dụ:giá trị trung bình của những dự đoán đó mang lại ước tính hiệu quả hơn.
Rừng Ngẫu nhiên là một phần mở rộng qua việc đóng bao. Cần thêm một bước nữa để dự đoán một tập hợp con ngẫu nhiên của các bản ghi. Nó cũng tạo ra một lựa chọn ngẫu nhiên các tính năng thay vì sử dụng tất cả các tính năng để phát triển cây. Khi nó có thể có nhiều cây ngẫu nhiên, nó được gọi là Rừng ngẫu nhiên.
Bagging cũng đã được tận dụng với các mô hình học sâu trong thị trường tài chính, tự động hóa các chức năng quan trọng, chẳng hạn như phát hiện gian lận, tính toán rủi ro tín dụng và các vấn đề về định giá quyền chọn.
Nghiên cứu này chứng minh cách thức mà một số kỹ thuật học máy đã được tận dụng để tạo ra rủi ro vỡ nợ. Nghiên cứu này hiểu cách đóng túi hỗ trợ giảm thiểu rủi ro bằng cách tránh gian lận thẻ tín dụng trong các tổ chức tài chính và ngân hàng.
Tăng cường
Thúc đẩy là một quá trình tổng hợp khác để tạo ra một tập hợp các yếu tố dự đoán. Nói cách khác, nó có thể phù hợp với các cây liên tiếp, thường là các mẫu ngẫu nhiên và ở mọi giai đoạn, mục tiêu là giải quyết sai số ròng từ các cây trước đó.
Thúc đẩy thường được sử dụng để giảm sự thiên vị và phương sai trong kỹ thuật học tập có giám sát. Nó xác định họ của một thuật toán thay đổi những người học yếu (người học cơ bản) thành người học mạnh. Người học yếu là những phân loại chỉ đúng ở một mức độ nhỏ so với phân loại thực tế, trong khi những học sinh học mạnh là những phân loại có tương quan tốt với phân loại thực tế.
Hãy để chúng tôi xem so sánh giữa Đóng túi và Tăng cường.
Đóng bao | Tăng cường |
---|---|
Mục tiêu để giảm phương sai, không phải thành kiến. | Mục tiêu để giảm độ chệch, không phải phương sai. |
Mỗi mô hình được xây dựng độc lập. | Các mô hình mới bị ảnh hưởng bởi việc triển khai mô hình đã phát triển trước đây. |
Đây là cách đơn giản nhất để kết nối các dự đoán thuộc về một loại tương tự. | Đây là một phương pháp kết nối các dự đoán thuộc nhiều loại. |
Đóng bao cố gắng giải quyết vấn đề lắp quá chặt. | Tăng cường cố gắng giảm sự thiên vị. |
Một số tập hợp con dữ liệu đào tạo được rút ra ngẫu nhiên với sự thay thế từ toàn bộ tập dữ liệu đào tạo. | Mỗi tập hợp con mới bao gồm các thành phần đã bị phân loại sai bởi các mô hình trước đó. |
Đóng bao có thể giải quyết vấn đề quá vừa vặn. | Tăng cường có thể làm tăng vấn đề quá phù hợp. |