Tập hợp các mặt hàng thường xuyên tối đa là gì?

Một tập phổ biến tối đa được biểu diễn như một tập phổ biến mà không có tập nào trong số các tập thay thế trực tiếp của nó là thường xuyên. Các tập hợp mục trong mạng tinh thể được chia thành hai nhóm như nhóm thường xuyên và nhóm không thường xuyên. Đường viền tập hợp phổ biến, được xác định bằng một đường đứt nét.

Mỗi tập hợp mục nằm trên đường viền là thường xuyên, trong khi những mục nằm dưới đường viền (các nút được tô bóng) là không thường xuyên. Giữa các tập phổ biến nằm gần biên giới, {a, d}, {a, c, e} và {b, c, d, e} được coi là các tập phổ biến tối đa vì các tập thay thế trực tiếp của chúng là không thường xuyên.

Tập phổ biến bao gồm {a, d} có tần suất tối đa vì một số tập thay thế trực tiếp, {a, b, d}, {a, c, d} và {a, d, e}, là không thường xuyên. Ngược lại, {a, c} không phải là cực đại vì các tập thay thế trực tiếp, {a, c, e}, là thường xuyên.

Tập phổ biến tối đa hỗ trợ đầy đủ một mô tả ngắn gọn về các tập phổ biến thường xuyên. Nói cách khác, chúng tạo thành tập phổ biến nhỏ nhất mà từ đó một số tập phổ biến có thể được dẫn xuất. Ví dụ:các tập phổ biến có thể được chia thành hai nhóm như sau -

Các tập hợp mục thông thường bắt đầu bằng mục a và có thể bao gồm các mục c, d hoặc e. Nhóm này chứa các tập mục bao gồm {a), {a, c), {a, d}, {a, e} và {a, c, e}.
Các tập phổ biến thường bắt đầu bằng các mục b, c, d hoặc e. Nhóm này chứa các tập mục bao gồm {b}, {b, c}, {c, d}, {b, c, d, e}, v.v.

Các tập hợp mục thường áp dụng trong nhóm đầu tiên là các tập hợp con của {a, c, e} hoặc {a, d}, trong khi những tập hợp áp dụng trong nhóm thứ hai là các tập hợp con của {b, c, d, e}. Do đó, tập phổ biến tối đa {a, c, e}, {a, d} và {b, c, d, e} hỗ trợ mô tả ngắn gọn về tập phổ biến.

Tập phổ biến tối đa hỗ trợ một mô tả có giá trị cho các tập dữ liệu có thể tạo ra các tập phổ biến rất cao, vì có một số tập phổ biến theo cấp số nhân trong dữ liệu đó. Phương pháp này chỉ thực tế nếu một thuật toán hiệu quả xảy ra để khám phá một cách rõ ràng các tập phổ biến lớn nhất mà không cần phải liệt kê một số tập con.

Mặc dù hỗ trợ một mô tả nhỏ gọn, các tập phổ biến tối đa không bao gồm dữ liệu hỗ trợ của các tập con của chúng. Ví dụ:sự hỗ trợ của các tập phổ biến tối đa {a, c, e}, {a, d} và {b, c, d, e} không đưa ra bất kỳ ý tưởng nào về việc hỗ trợ các tập con của chúng.

Cần phải có thêm một lần vượt qua tập dữ liệu để quyết định số lượng hỗ trợ của các tập phổ biến không cực đại. Trong một số trường hợp, có thể mong muốn có một mô tả tối thiểu về các tập phổ biến thường xuyên để bảo toàn dữ liệu hỗ trợ.