Chỉ mục đảo ngược và Chỉ mục chuyển tiếp là cấu trúc dữ liệu được sử dụng để tìm kiếm văn bản trong một tài liệu hoặc tập hợp các tài liệu.
Chỉ mục đảo ngược
Inverted Index lưu trữ các từ dưới dạng chỉ mục và (các) tên tài liệu dưới dạng (các) tham chiếu được ánh xạ.
Chỉ số chuyển tiếp
Forward Index lưu trữ tên tài liệu dưới dạng chỉ mục và (các) từ dưới dạng (các) tham chiếu được ánh xạ.
Sau đây là một số khác biệt quan trọng giữa Chỉ số đảo ngược và Chỉ số chuyển tiếp.
Sr. Không. | Phím | Chỉ mục Đảo ngược | Chỉ mục chuyển tiếp |
---|---|---|---|
1 | Dạng ánh xạ | Chỉ mục ngược lưu trữ các từ dưới dạng chỉ mục và (các) tên tài liệu dưới dạng (các) tham chiếu được ánh xạ. | Chỉ mục chuyển tiếp lưu tên tài liệu dưới dạng chỉ mục và (các) từ dưới dạng (các) tham chiếu được ánh xạ. |
2 | Quy trình Xây dựng Chỉ mục |
|
|
3 | Lập chỉ mục | Trong chỉ mục Đảo ngược, việc lập chỉ mục diễn ra chậm vì phải kiểm tra từng từ trước khi chuẩn bị chỉ mục. | Trong chỉ mục chuyển tiếp, việc lập chỉ mục diễn ra nhanh chóng vì các từ khóa được thêm vào khi tìm thấy. |
4 | Đang tìm kiếm | Trong chỉ mục Đảo ngược, tìm kiếm khá nhanh. | Trong chỉ mục chuyển tiếp, tìm kiếm chậm. |
5 | Ví dụ | Word Documents ------------------------- Welcome doc1 Hello doc1, doc3 Hi doc2 ------------------------- | Word Documents ------------------------- doc1 Welcome, Hello doc2 Hi doc3 Hello ------------------------- |
6 | Tính trùng lặp | Trong chỉ mục Đảo ngược, không có từ khóa trùng lặp nào được lưu trữ trong một chỉ mục. | Trong chỉ mục chuyển tiếp, các từ khóa trùng lặp có thể xuất hiện trong chỉ mục như 'Xin chào'. |
7 | Ví dụ trong Đời thực | Bảng chú giải thuật ngữ ở cuối chỉ mục, Tra cứu ngược. | Mục lục ở đầu sách, tra cứu DNS. |