Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các nhiệm vụ của khai thác liên kết là gì?

Có một số nhiệm vụ khai thác liên kết như sau -

  • Phân loại đối tượng dựa trên liên kết - Trong các cách tiếp cận phân loại truyền thống, các đối tượng được phân loại phụ thuộc vào các thuộc tính xác định chúng. Phân loại dựa trên liên kết dự đoán danh mục của một đối tượng không chỉ phụ thuộc vào các thuộc tính của nó mà còn phụ thuộc vào các liên kết của nó và các thuộc tính của các đối tượng được liên kết.

    Phân loại trang web là một ví dụ được xác định rõ ràng của phân loại dựa trên liên kết. Nó dự đoán phân loại của một trang web dựa trên sự xuất hiện của từ (các từ xuất hiện trên trang) và văn bản liên kết (các từ siêu liên kết, tức là các từ mà nó có thể nhấp vào khi nó có thể nhấp vào một liên kết), cả hai đều phục vụ dưới dạng các thuộc tính. Hơn nữa, việc phân loại phụ thuộc vào các liên kết giữa các trang và các thuộc tính khác nhau của các trang và các liên kết.

  • Dự đoán loại đối tượng - Điều này dự đoán loại của một đối tượng, tùy thuộc vào các thuộc tính và các liên kết của nó, và vào các thuộc tính của các đối tượng được kết nối với nó. Trong miền thư mục, có thể được yêu cầu dự đoán loại địa điểm của một ấn phẩm là hội nghị, tạp chí hoặc hội thảo. Trong miền kết nối, nhiệm vụ tương tự là dự đoán xem một liên hệ kết nối là qua e-mail, cuộc gọi điện thoại hay thư.

  • Dự đoán loại liên kết - Điều này dự đoán loại hoặc mục tiêu của một liên kết, tùy thuộc vào thuộc tính của các đối tượng được chứa. Ví dụ, với dữ liệu dịch tễ học, nó có thể cố gắng dự đoán liệu hai người hiểu nhau là thành viên trong gia đình, đồng nghiệp hay người quen.

  • Dự đoán sự tồn tại của liên kết - Không giống như dự đoán kiểu liên kết, nơi nó có thể hiểu một kết nối tồn tại giữa hai đối tượng và được yêu cầu dự đoán kiểu của nó, thay vào đó nó có thể muốn dự đoán liệu một liên kết có tồn tại giữa hai đối tượng hay không. Các ví dụ bao gồm dự đoán liệu có liên kết giữa hai trang Web và liệu một bài báo có trích dẫn bài báo khác hay không.

  • Ước tính số lượng liên kết - Có hai hình thức ước lượng số lượng liên kết. Đầu tiên, nó có thể dự đoán số lượng liên kết đến một đối tượng. Điều này có lợi, chẳng hạn, trong việc dự đoán tính thẩm quyền của một trang Web phụ thuộc vào số lượng liên kết đến nó (liên kết trong). Tương tự, nhiều liên kết ngoài có thể được sử dụng để nhận ra các trang Web hoạt động như trung tâm, trong đó trung tâm là một hoặc một tập hợp các trang Web trỏ đến một số trang có thẩm quyền của cùng một trường hợp.

  • Điều chỉnh đối tượng - Trong đối chiếu đối tượng, chức năng là dự đoán xem hai đối tượng có giống nhau theo nghĩa đen hay không, dựa trên các thuộc tính và liên kết của chúng. Chức năng này phổ biến trong việc trích xuất thông tin, loại bỏ trùng lặp, hợp nhất đối tượng và kết nối trích dẫn, và còn được gọi là liên kết bản ghi hoặc sự không chắc chắn về danh tính.