Computer >> Máy Tính >  >> Lập trình >> Lập trình

Làm cách nào chúng ta có thể sử dụng các ràng buộc quy tắc để lược bớt không gian tìm kiếm?

Ràng buộc quy tắc có thể được phân loại thành năm yếu tố sau như sau -

Antimonotonic - Các yếu tố đầu tiên của ràng buộc là phản đơn âm. Xem xét ràng buộc quy tắc “sum (I.price) ≤ 100”. Hãy xem xét rằng nó đang sử dụng khung Apriori, ở mỗi lần lặp k phân tích các tập phổ biến có kích thước k. Nếu tổng chi phí của các mục trong một tập hợp không nhỏ hơn 100, thì tập hợp này có thể được rút ngắn khỏi không gian tìm kiếm, bởi vì việc chèn nhiều mục hơn vào tập sẽ chỉ tạo ra chi phí cao hơn và do đó sẽ không thỏa mãn hạn chế.

Việc cắt tỉa theo các ràng buộc phản độc tố có thể được sử dụng ở mỗi lần lặp lại các thuật toán kiểu Apriori để giúp cải thiện hiệu quả của giai đoạn khai thác hoàn chỉnh trong khi đảm bảo tính hoàn chỉnh của dịch vụ khai thác dữ liệu.

Thuộc tính Apriori, định nghĩa rằng tất cả các tập con không rỗng của một tập phổ biến phải là thường xuyên, là phản đơn nguyên. Nếu một tập hợp vật phẩm nhất định không sử dụng hỗ trợ tối thiểu, thì không tập hợp nào trong số các tập hợp trên của nó có thể. Thuộc tính này có thể được sử dụng ở mỗi lần lặp lại của thuật toán Apriori để giảm nhiều tập mục ứng viên được kiểm tra, do đó giảm không gian tìm kiếm cho các quy tắc kết hợp.

Đơn âm - Yếu tố thứ hai của ràng buộc là đơn điệu. Nếu ràng buộc quy tắc là "sum (I.price) ≥ 100", thì phương pháp xử lý dựa trên ràng buộc có thể khác.

Nếu một tập hợp vật phẩm mà tôi thỏa mãn hạn chế, tức là tổng giá trong tập hợp đó không nhỏ hơn 100, thì việc thêm nhiều vật phẩm vào tôi sẽ làm tăng chi phí và sẽ liên tục đáp ứng ràng buộc.

Do đó, thử nghiệm nhiều hơn về ràng buộc này trên tập phổ biến mà tôi phát triển thành dư thừa. Nói cách khác, nếu một tập phổ biến sử dụng ràng buộc quy tắc này, thì tất cả các tập hợp con của nó cũng vậy. Nếu một ràng buộc quy tắc thực thi thuộc tính này, thì thuộc tính này là đơn điệu.

Ràng buộc gọn gàng - Yếu tố thứ ba là các ràng buộc ngắn gọn. Đối với yếu tố ràng buộc này, nó có thể liệt kê một số bộ được đảm bảo sử dụng ràng buộc. Nếu một ràng buộc quy tắc là ngắn gọn, nó có thể trực tiếp tạo chính xác các bộ thỏa mãn nó, ngay cả trước khi bắt đầu đếm hỗ trợ. Điều này ngăn chặn chi phí lớn của mô hình tạo và thử nghiệm.

Các ràng buộc có thể chuyển đổi - Yếu tố thứ tư là các ràng buộc có thể chuyển đổi. Nếu các mục trong tập phổ biến được sắp xếp theo một thứ tự cụ thể, thì ràng buộc có thể trở thành đơn điệu hoặc phản đơn điệu liên quan đến quá trình khai thác tập phổ biến thường xuyên.

Ví dụ, ràng buộc “avg (I.price) ≤ 100” không phải là phản đơn điệu hay đơn điệu. Nếu các mục trong một giao dịch được chèn vào một tập hợp vật phẩm trong chuỗi giá tăng dần, thì ràng buộc sẽ trở thành phản đơn nguyên, bởi vì nếu một tập hợp vật phẩm tôi phá vỡ ràng buộc (tức là với chi phí trung bình cao hơn 100 đô la), do đó, việc bổ sung nhiều mặt hàng đắt tiền hơn vào itemset sẽ không tạo nó bằng cách sử dụng ràng buộc.