Computer >> Máy Tính >  >> Lập trình >> Lập trình

Đếm hỗ trợ là gì?

Đếm hỗ trợ là thủ tục quyết định tần suất xuất hiện cho mỗi tập hợp vật phẩm ứng viên tồn tại sau bước cắt bỏ ứng viên của hàm apriori-gen.

Một phương pháp để thực hiện việc này là so sánh từng giao dịch với từng tập mục ứng viên và làm mới số lượng hỗ trợ của các ứng viên được bao gồm trong giao dịch. Phương pháp này tốn kém về mặt tính toán, đặc biệt khi có nhiều giao dịch và tập phổ biến ứng viên cao.

Cách tiếp cận thứ hai là liệt kê các tập mục được bao gồm trong mỗi giao dịch và cần chúng để làm mới số lượng hỗ trợ của các tập mục ứng viên cụ thể của chúng. Hãy xem xét một giao dịch t bao gồm năm mục, {I, 2, 3, 5 và 6}. Có (5 3) =10 bộ vật phẩm cỡ 3 được bao gồm trong giao dịch này.

Các tập hợp mục khác nhau có thể tương ứng với tập hợp 3 mục ứng viên đang được phân tích, trong trường hợp đó, số lượng hỗ trợ của chúng được tăng lên. Có thể bỏ qua các tập con khác nhau của t không tương ứng với một số ứng cử viên.

Một cách tiếp cận có hệ thống để liệt kê các tập hợp 3 mục có trong t. Xem xét rằng mỗi tập hợp mục duy trì các mục của nó trong việc cải thiện thứ tự từ vựng, một tập hợp mục có thể được liệt kê bằng cách xác định mục nhỏ nhất trước, sau đó là các mục cao hơn.

Ví dụ:cho trước t:{1, 2, 3, 5 và 6}, tất cả 3 tập vật phẩm có trong t phải bắt đầu bằng các mục 1, 2 hoặc 3. Không thể áp dụng để tạo một tập hợp 3 mục bắt đầu với mục 5 hoặc 6 vì có hai mục trong t có nhãn cao hơn hoặc bằng 5.

Cấu trúc tiền tố cho thấy cách các tập hợp mục bao gồm trong một giao dịch có thể được liệt kê một cách nhất quán, tức là bằng cách xác định từng mục của chúng, từ mục ngoài cùng bên trái đến mục ngoài cùng bên phải.

Nó có thể xác định xem mỗi tập hợp 3 mục được liệt kê có tương quan với một tập hợp mục ứng viên hiện có hay không. Nếu nó kết nối một trong các ứng cử viên, do đó, số lượng hỗ trợ của ứng viên tương quan sẽ tăng lên.

Trong thuật toán Apriori, các tập mục ứng viên được chia thành nhiều nhóm và được lưu trong một cây băm. Trong quá trình đếm hỗ trợ, các nhóm vật phẩm được bao gồm trong mỗi giao dịch cũng được băm thành các nhóm phù hợp của chúng. Thay vì so sánh từng tập hợp mục trong giao dịch với từng tập hợp vật phẩm ứng viên, nó chỉ được kết nối với các tập hợp vật phẩm ứng viên thuộc một nhóm tương tự.

Mỗi nút bên trong của cây cần có hàm băm sau, h (p):p mod 3, để xác định nhánh nào của nút hiện tại phải tiếp theo. Ví dụ:các mục 1, 4 và 7 được băm thành cùng một nhánh (tức là nhánh ngoài cùng bên trái) vì chúng có phần còn lại tương tự nhau sau khi tách số cho 3. Tất cả các tập mục ứng viên được lưu tại các nút lá của cây băm.