Computer >> Máy Tính >  >> Lập trình >> Lập trình

Tiêu chí của việc khai thác mô hình thường xuyên là gì?

Có một số tiêu chí khai thác mẫu thường xuyên như sau -

Dựa trên mức độ hoàn chỉnh của các mẫu được khai thác - Nó có thể khai thác toàn bộ bộ sưu tập các tập phổ biến thường xuyên, các tập phổ biến đã đóng và các tập phổ biến tối đa, cung cấp một ngưỡng hỗ trợ tối thiểu.

Nó cũng có thể trích xuất các tập phổ biến bị ràng buộc (Nó có thể đáp ứng một tập hợp các ràng buộc do người dùng xác định), các tập phổ biến gần đúng (Nó chỉ có thể thay đổi số lượng hỗ trợ gần đúng cho các tập phổ biến được khai thác), các tập phổ biến gần khớp (Nó có thể đếm số lượng hỗ trợ trong số các tập phổ biến tương đối phù hợp), tập phổ biến hàng đầu (tức là k tập phổ biến nhất cho một giá trị do người dùng chỉ định, k), v.v.

Có một số ứng dụng có thể có nhiều yêu cầu liên quan đến tính toàn vẹn của các mẫu được khai thác, điều này có thể dẫn đến các cách tính toán và cách tiếp cận tối ưu hóa khác nhau.

Dựa trên mức độ trừu tượng có trong bộ quy tắc - Có một số phương pháp để khai thác quy tắc kết hợp có thể khám phá các quy tắc ở nhiều cấp độ trừu tượng. Ví dụ:hãy xem xét rằng một nhóm các quy tắc kết hợp được khai thác liên quan đến các quy tắc sau đây trong đó X là một biến xác định khách hàng -

mua (X, “máy tính”) ⇒ mua (X, “máy in HP”)

mua (X, “máy tính xách tay”) ⇒ mua (X, “máy in HP”)

Dựa trên số thứ nguyên dữ liệu được bao gồm trong quy tắc - Nếu các mục hoặc thuộc tính trong quy tắc kết hợp chỉ tham chiếu đến một thứ nguyên, thì đó là quy tắc kết hợp một chiều.

Dựa trên các loại giá trị được xử lý trong quy tắc - Nếu một quy tắc chứa các liên kết giữa sự tồn tại và vắng mặt của các mục, thì đó là quy tắc kết hợp Boolean. Nếu một quy tắc xác định các liên kết giữa các mục hoặc thuộc tính định lượng, thì đó là quy tắc liên kết định lượng. Trong các quy tắc này, các giá trị định lượng cho các mục hoặc thuộc tính được phân tách thành các khoảng.

Dựa trên các loại quy tắc được khai thác - Phân tích mẫu thường xuyên có thể tạo ra một số loại quy tắc và các mối quan hệ thú vị khác nhau. Các quy tắc kết hợp là loại quy tắc nổi tiếng được tạo ra từ các mẫu thường xuyên.

Dựa trên các loại mẫu được khai thác - Một số loại mẫu thường xuyên có thể được khai thác từ nhiều loại tập dữ liệu. Mục tiêu chính là khai thác tập phổ biến thường xuyên, tức là khai thác các tập phổ biến thường xuyên (tập hợp các mục) từ các tập dữ liệu giao dịch hoặc quan hệ.

Khai phá mẫu tuần tự tìm kiếm các chuỗi con thường xuyên trong một tập dữ liệu trình tự, trong đó một chuỗi dữ liệu sắp xếp thứ tự các sự kiện. Ví dụ:với khai thác mô hình tuần tự, nó có thể nghiên cứu chuỗi các mặt hàng thường được mua. Ví dụ:trước tiên, người dùng có thể có xu hướng mua PC, sau đó là máy ảnh kỹ thuật số và sau đó là thẻ nhớ.