Lọc cộng tác là một sự khác biệt của lập luận dựa trên bộ nhớ, đặc biệt thích hợp cho việc áp dụng hỗ trợ các đề xuất được cá nhân hóa. Hệ thống lọc cộng tác bắt đầu với lịch sử sở thích của từng người. Hàm khoảng cách quyết định sự giống nhau phụ thuộc vào sự trùng lặp của sở thích những người thích cùng một thứ ở gần nhau.
Hơn nữa, các phiếu bầu được tính theo khoảng cách, do đó, phiếu bầu của những người hàng xóm gần gũi hơn được tính nhiều hơn cho sự tán thành. Nói một cách khác, đó là một cách tiếp cận để khám phá âm nhạc, sách, rượu hoặc một ai đó khác phù hợp với sở thích hiện tại của một người cụ thể bằng cách sử dụng các đánh giá của một nhóm đồng đẳng lựa chọn cho cùng sở thích của họ. Phương pháp này được gọi là lọc thông tin xã hội.
Lọc cộng tác tự động hóa quy trình sử dụng truyền miệng để xác định xem họ có thể thích thứ gì đó hay không. Biết rằng một số người thích một cái gì đó là không đủ. Mọi người đều coi trọng một số đề xuất hơn những đề xuất khác. Lời giới thiệu của một người bạn thân mà những lời giới thiệu trước đó đã đi đúng vào trọng tâm có thể đủ để khiến bạn đi xem một bộ phim mới ngay cả khi nó thuộc thể loại mà nó thường có thể không thích.
Chuẩn bị các đề xuất cho người dùng mới bằng hệ thống lọc cộng tác tự động có ba bước như sau -
-
Nó có thể được xây dựng một hồ sơ người dùng bằng cách tiếp nhận khách hàng mới để xếp hạng một loạt các mục bao gồm phim, bài hát hoặc nhà hàng.
-
Nó có thể là so sánh hồ sơ của người dùng mới với hồ sơ của những người dùng khác bằng cách sử dụng một số biện pháp tương đồng.
-
Nó có thể sử dụng một số kết hợp xếp hạng của những người dùng có cùng cấu hình để dự báo xếp hạng mà người dùng mới có thể cung cấp cho các mặt hàng mà nó chưa được xếp hạng.
Một thách thức với lọc cộng tác là có nhiều mục được xếp hạng hơn nhiều so với một người nào đó có khả năng đã hoàn thành hoặc sẵn sàng xếp hạng. Nghĩa là, các cấu hình thường thưa thớt, xác định rằng có rất ít sự trùng lặp giữa các tùy chọn tạo đề xuất của người dùng. Hãy nghĩ về hồ sơ khách hàng như một vectơ với một thành phần cho mỗi mặt hàng trong vũ trụ các yếu tố được xếp hạng. Mỗi phần tử của vectơ xác định xếp hạng của chủ sở hữu hồ sơ cho phần tử tương ứng trên thang từ –5 đến 5 với 0 biểu thị mức độ trung lập và các giá trị trống không có ý kiến.
Nếu có hàng nghìn thành phần trong vectơ và mỗi người dùng quyết định xếp hạng thành phần nào, thì bất kỳ hồ sơ của hai người dùng nào cũng có thể có một số trùng lặp. Nói cách khác, việc buộc người dùng xếp hạng một tập hợp con cụ thể có thể bỏ sót dữ liệu thú vị vì xếp hạng của các yếu tố khó hiểu hơn có thể nói nhiều hơn về người dùng hơn là xếp hạng của những yếu tố chung chung.