Computer >> Máy Tính >  >> Lập trình >> Lập trình

Sự khác biệt giữa Chỉ số đảo ngược và Chỉ số chuyển tiếp


Chỉ mục đảo ngược và Chỉ mục chuyển tiếp là cấu trúc dữ liệu được sử dụng để tìm kiếm văn bản trong một tài liệu hoặc tập hợp các tài liệu.

Chỉ mục đảo ngược

Inverted Index lưu trữ các từ dưới dạng chỉ mục và (các) tên tài liệu dưới dạng (các) tham chiếu được ánh xạ.

Chỉ số chuyển tiếp

Forward Index lưu trữ tên tài liệu dưới dạng chỉ mục và (các) từ dưới dạng (các) tham chiếu được ánh xạ.

Sau đây là một số khác biệt quan trọng giữa Chỉ số đảo ngược và Chỉ số chuyển tiếp.

Sr. Không. Phím Chỉ mục Đảo ngược Chỉ mục chuyển tiếp
1 Dạng ánh xạ Chỉ mục ngược lưu trữ các từ dưới dạng chỉ mục và (các) tên tài liệu dưới dạng (các) tham chiếu được ánh xạ. Chỉ mục chuyển tiếp lưu tên tài liệu dưới dạng chỉ mục và (các) từ dưới dạng (các) tham chiếu được ánh xạ.
2 Quy trình Xây dựng Chỉ mục
  • Quét tài liệu, chuẩn bị danh sách các từ duy nhất.

  • Chuẩn bị một danh sách các chỉ mục của tất cả các từ duy nhất và ánh xạ chúng để tìm kiếm tài liệu.

  • Lặp lại các bước trên cho tất cả các tài liệu.

  • Quét tài liệu, chuẩn bị danh sách các từ duy nhất.

  • Ánh xạ tất cả các từ vào tài liệu dưới dạng chỉ mục.

  • Lặp lại các bước trên cho tất cả các tài liệu.

3 Lập chỉ mục Trong chỉ mục Đảo ngược, việc lập chỉ mục diễn ra chậm vì phải kiểm tra từng từ trước khi chuẩn bị chỉ mục. Trong chỉ mục chuyển tiếp, việc lập chỉ mục diễn ra nhanh chóng vì các từ khóa được thêm vào khi tìm thấy.
4 Đang tìm kiếm Trong chỉ mục Đảo ngược, tìm kiếm khá nhanh. Trong chỉ mục chuyển tiếp, tìm kiếm chậm.
5 Ví dụ
Word Documents
-------------------------
Welcome doc1
Hello doc1, doc3
Hi doc2
-------------------------
Word Documents
-------------------------
doc1 Welcome, Hello
doc2 Hi
doc3 Hello
-------------------------
6 Tính trùng lặp Trong chỉ mục Đảo ngược, không có từ khóa trùng lặp nào được lưu trữ trong một chỉ mục. Trong chỉ mục chuyển tiếp, các từ khóa trùng lặp có thể xuất hiện trong chỉ mục như 'Xin chào'.
7 Ví dụ trong Đời thực Bảng chú giải thuật ngữ ở cuối chỉ mục, Tra cứu ngược. Mục lục ở đầu sách, tra cứu DNS.