Học quy tắc kết hợp là một loại phương pháp học tập không giám sát nhằm kiểm tra sự phụ thuộc của một phần tử dữ liệu này vào một phần tử dữ liệu khác và tạo một cách thích hợp để nó có thể hiệu quả hơn. Nó cố gắng khám phá một số quan hệ hoặc quan hệ thú vị giữa các biến của tập dữ liệu. Nó phụ thuộc vào một số quy tắc để tìm mối quan hệ thú vị giữa các biến trong cơ sở dữ liệu.
Học quy tắc kết hợp là kỹ thuật quan trọng của máy học và nó được sử dụng trong phân tích giỏ thị trường, khai thác sử dụng web, sản xuất liên tục, v.v. Trong phân tích giỏ thị trường, nó được một số nhà bán lẻ lớn sử dụng để tìm mối quan hệ giữa các mặt hàng .
Các quy tắc liên kết ban đầu được chuyển đổi từ dữ liệu điểm bán hàng đại diện cho những sản phẩm được mua cùng nhau. Mặc dù nguồn gốc của nó là liên kết các giao dịch tại điểm bán hàng, các quy tắc liên kết có thể được sử dụng bên ngoài thị trường bán lẻ để tìm mối quan hệ giữa các loại “giỏ”.
Có nhiều ứng dụng khác nhau của Quy tắc kết hợp như sau -
-
Các mặt hàng được mua bằng thẻ tín dụng, chẳng hạn như ô tô cho thuê và phòng khách sạn, hỗ trợ thông tin chi tiết về sản phẩm mà khách hàng có khả năng mua sau đây.
-
Các dịch vụ tùy chọn do người dùng kết nối từ xa mua (chờ cuộc gọi, chuyển tiếp cuộc gọi, DSL, cuộc gọi tốc độ, v.v.) hỗ trợ quyết định cách gói các chức năng này để tối đa hóa doanh thu.
-
Các dịch vụ ngân hàng được người dùng bán lẻ sử dụng (tài khoản ngành tiền tệ, đĩa CD, dịch vụ đầu tư, cho vay mua ô tô, v.v.) nhận ra người dùng có khả năng cần các dịch vụ khác.
-
Nhóm yêu cầu bảo hiểm bất thường có thể là một biểu hiện của gian lận và có thể gây ra cuộc điều tra cao hơn.
-
Lịch sử bệnh nhân y khoa có thể hỗ trợ các biểu hiện của các biến chứng có thể xảy ra dựa trên một số phương pháp điều trị nhất định.
Các quy tắc liên kết phù hợp với mong đợi. Ví dụ:chúng không phải là phương pháp tốt nhất để sản xuất các mô hình bán kèm trên thị trường như ngân hàng bán lẻ, vì các quy tắc cuối cùng mô tả các chương trình khuyến mãi tiếp thị trước đó. Ngoài ra, trong ngân hàng bán lẻ, người dùng thường bắt đầu với tài khoản séc và sau đó là tài khoản tiết kiệm. Sự khác biệt giữa các sản phẩm không xảy ra cho đến khi người dùng có sản phẩm cao hơn.
Trong Thuật toán Apriori, thuật toán này cần các tập dữ liệu thường xuyên để tạo các quy tắc kết hợp. Nó được tạo ra để hoạt động trên cơ sở dữ liệu bao gồm các giao dịch. Thuật toán này cần tìm kiếm theo chiều rộng và cây băm để tính toán tập phổ biến một cách hiệu quả.
Nó thường được sử dụng để phân tích giỏ thị trường và hỗ trợ để hiểu các sản phẩm có thể được mua. Nó được sử dụng trong không gian chăm sóc sức khỏe để khám phá các phản ứng của thuốc cho bệnh nhân.
Trong thuật toán Eclat, nó đại diện cho sự chuyển đổi lớp tương đương. Thuật toán này cần một phương pháp tìm kiếm theo chiều sâu để khám phá các tập phổ biến trong cơ sở dữ liệu giao dịch. Nó thực hiện việc triển khai nhanh hơn Thuật toán Apriori.