Chúng tôi coi Internet và vô số kiến thức của nó là điều hiển nhiên. Hầu như mọi thứ đều có thể truy cập dễ dàng 24 giờ một ngày, 7 ngày một tuần chỉ bằng một nút bấm. Đó là - cho đến khi nó không. Các trang web có thể hoạt động mà không cần thông báo trong giây lát, nội dung của chúng sẽ biến mất vĩnh viễn.
Điều quan trọng là phải lưu trữ nội dung xuất hiện trên Internet vì nhiều lý do khác nhau. Lưu trang web là một cách để bảo tồn văn hóa nhân loại, giống như cách chúng ta bảo vệ và quản lý sách hoặc tác phẩm nghệ thuật. Sự tò mò là một động lực lớn - sau tất cả, trẻ em ngày nay không thể hình dung ra một trang web Geocities cũ trong những giấc mơ hoang đường nhất của chúng. Ngoài sự tò mò chung, việc lưu các trang web có thể cho phép chúng tôi tham khảo lại thông tin quan trọng.
Thật là tiện lợi khi tham khảo thông tin tìm thấy trên Web. Nhưng điều gì sẽ xảy ra khi liên kết đó chỉ đến thông báo lỗi 404? Vào năm 2013, một nghiên cứu của Harvard cho thấy 49% các trang web được tham chiếu đến các quyết định của Tòa án Tối cao ở Mỹ hiện đã trở thành ngõ cụt. Làm cách nào chúng ta có thể ngăn những thông tin quan trọng như thế này biến mất vào đồng ether ảo?
May mắn thay, những người ở The Internet Archive đã phát triển một công cụ có thể lập chỉ mục và lưu trữ các trang web. Họ gọi nó là Wayback Machine và nó đã lưu trữ các trang web từ năm 2001. Đến nay, Wayback Machine đã lưu hơn 304 tỷ trang web.
Có một số lý do mà người ta muốn lưu trữ một trang web. May mắn thay, The Wayback Machine làm cho nó trở nên siêu dễ dàng. Dưới đây là những cách bạn có thể sử dụng The Wayback Machine cho tất cả các nhu cầu lưu trữ trang web của mình.
Trang web nào được lập danh mục?
Nhiều trang web phổ biến được Wayback Machine tự động lưu trữ. Tuy nhiên, bạn có thể sử dụng Wayback Machine để lưu trữ thủ công hầu như bất kỳ trang nào. Các trang web thường bị bỏ rơi hoặc thay đổi hoàn toàn, vì vậy máy Wayback hoạt động như một cách để bảo tồn văn hóa của Internet bằng cách lưu giữ một “bản cứng” kỹ thuật số của một trang web. Lưu ý rằng văn bản và hình ảnh được để nguyên vẹn; tuy nhiên, một số liên kết ra ngoài và các mục được nhúng (ví dụ:video) thì không.
Điều quan trọng cần lưu ý là The Wayback Machine chỉ quét và lưu trữ các trang web công cộng. Điều này có nghĩa là không thể lưu trữ các trang web được bảo vệ bằng mật khẩu hoặc những trang nằm trên máy chủ riêng. Ngoài ra, nếu một trang web cấm các công cụ tìm kiếm đưa nó vào kết quả tìm kiếm, Wayback Machine sẽ không thể lưu trữ nó.
Cách sử dụng Máy quay lui
Có hai phương pháp bạn có thể sử dụng để bắt đầu lưu trữ trang web. May mắn thay, cả hai đều siêu dễ dàng và không yêu cầu bất kỳ bí quyết đặc biệt nào. Bắt đầu bằng cách đặt con trỏ của bạn trước URL trong thanh địa chỉ của trình duyệt. Nhập web.archive.org/save/
và nhấn Enter. Một hộp thoại sẽ xuất hiện trên màn hình của bạn thông báo cho bạn biết rằng Wayback Machine đang lưu trang.
Cách thứ hai để lưu trữ một trang web là sử dụng trang web lưu trữ Wayback Machine. Đầu tiên, điều hướng đến trang web bạn muốn lưu và sao chép URL. Sau khi hoàn tất, hãy truy cập trang web lưu trữ Wayback Machine. Ở phía bên phải của trang này, bạn sẽ thấy tiêu đề có nội dung “Lưu trang ngay bây giờ”. Dán URL của trang web bạn muốn lưu vào hộp văn bản và nhấp vào nút “Lưu trang”.
Bất kể bạn sử dụng phương pháp nào, kết quả là như nhau. Lưu ý rằng việc lưu trang có thể mất một lúc, vì vậy hãy kiên nhẫn và để nó làm việc của mình.
Tiện ích mở rộng trình duyệt máy Wayback
Wayback Machine cũng có một tiện ích mở rộng trình duyệt chính thức cho Google Chrome. Sử dụng nó để lưu trữ các trang web rất dễ dàng. Chỉ cần điều hướng đến trang bạn muốn lưu trữ, nhấp vào biểu tượng Wayback Machine trên thanh công cụ của bạn và nhấp vào “Lưu trang ngay bây giờ”.
Ngoài việc giúp lưu trang dễ dàng hơn, tiện ích mở rộng của trình duyệt còn có một thủ thuật tiện lợi khác. Bạn đã bao giờ nhấp vào một liên kết chỉ để gặp phải thông báo lỗi 404 mơ hồ chưa? Cho dù đó là một nguồn có giá trị cho bài nghiên cứu của bạn hay một công thức thực sự tốt, nó có thể khiến bạn vô cùng thất vọng. Với phần mở rộng Wayback Machine được cài đặt, sự thất vọng đó có thể trở thành một sự thở phào nhẹ nhõm. Khi trình duyệt của bạn đi vào ngõ cụt, tiện ích mở rộng sẽ tìm kiếm kho lưu trữ để xem có bản sao đã lưu trên Wayback Machine hay không. Nếu có, nó sẽ hỏi bạn xem bạn có muốn truy cập trang đó không.
Nếu bạn không sử dụng Chrome, đừng lo lắng. Có một phần mở rộng Wayback Machine có sẵn cho Firefox; tuy nhiên, nó vẫn là một công việc đang được tiến hành. Ngoài ra, cũng có kế hoạch phát triển một tiện ích mở rộng cho người dùng Safari.
Archive-It
Bạn hoặc tổ chức của bạn có một trang web cần được lập chỉ mục và lưu trữ thường xuyên không? Nếu vậy, việc lưu trữ thủ công từng trang web riêng lẻ bằng các phương pháp trên có thể vô cùng tẻ nhạt và tốn kém. May mắn thay, Internet Archive cung cấp một dịch vụ có tên là Archive-It có thể tự động hóa quá trình lưu trữ cho bạn.
Dịch vụ này không miễn phí; tuy nhiên, nó có thể là lý tưởng cho những người muốn sao lưu nội dung của họ với tâm lý "thiết lập nó và quên nó đi". Chỉ cần quy định những trang nào bạn muốn lưu và tần suất. Đăng ký trả phí này hoàn hảo cho những ai muốn lưu nội dung web của họ một cách thường xuyên.
Bạn có sử dụng Wayback Machine không? Nếu vậy, bạn truy cập nó hoàn toàn để giải trí hay bạn thấy nó là một công cụ hữu ích? Có những cách nào khác để sao lưu nội dung trên Web không? Hãy cho chúng tôi biết trong phần bình luận!