Khai thác quy tắc kết hợp phát hiện mối quan hệ giữa các mục trong tập dữ liệu bằng cách sử dụng quy tắc "Nếu A, thì B" được đo bằng độ hỗ trợ (tần suất) và độ tin cậy (độ tin cậy). Khai thác quy tắc kết hợp đa cấp mở rộng điều này để tìm mối quan hệ ở các mức độ chi tiết khác nhau, chẳng hạn như giữa các sản phẩm riêng lẻ và danh mục sản phẩm.
Thông tin cơ bản về quy tắc kết hợp
Thuật toán Apriori được sử dụng rộng rãi để khai thác luật kết hợp. Nó lặp đi lặp lại tạo ra các tập mục ứng cử viên và loại bỏ những tập mục đó dưới ngưỡng hỗ trợ/độ tin cậy.
Điện tử Laptop Điện thoại Máy tính bảng Dell HP Cấp 0 Cấp 1 Cấp 2Các loại
- Mối quan hệ đa chiều trên các khía cạnh khác nhau (sản phẩm, khu vực, thời gian).
- Mối quan hệ đa cấp giữa các cấp độ chi tiết (mục riêng lẻ ↔ danh mục).
Phương pháp tiếp cận ngưỡng hỗ trợ
Ứng dụng
- Hành vi mua hàng của khách hàng bán lẻ, tối ưu hóa vị trí sản phẩm.
- Xác định mô hình bệnh tật trong chăm sóc sức khỏe, tối ưu hóa điều trị.
- Phát hiện gian lận Phát hiện bất thường trong tài chính và bảo hiểm.
- Khai thác web Phân tích sở thích của người dùng, cá nhân hóa nội dung.
- Phát hiện cộng đồng mạng xã hội, nhận dạng người có ảnh hưởng.
Thử thách
- Tính chiều cao Số lượng thuộc tính lớn làm tăng độ phức tạp.
- Bộ dữ liệu lớn Khối lượng bản ghi làm chậm quá trình xử lý.
- Khả năng mở rộng Bộ dữ liệu quá lớn để vừa với bộ nhớ đòi hỏi các phương pháp tiếp cận phân tán.
Kết luận
Khai thác quy tắc kết hợp đa cấp phát hiện ra các mối quan hệ ở các mức độ chi tiết khác nhau mà khai thác cấp đơn có thể bỏ qua. Việc lựa chọn cách tiếp cận ngưỡng hỗ trợ (đồng nhất, rút gọn hoặc dựa trên nhóm) giúp cân bằng việc khám phá mẫu với chi phí tính toán. Nó được áp dụng rộng rãi trong bán lẻ, chăm sóc sức khỏe, phát hiện gian lận và khai thác web.