Hướng dẫn này sẽ hướng dẫn bạn từng bước cách tải xuống tệp từ dòng lệnh trong Linux, Windows hoặc macOS bằng phần mềm nguồn mở (miễn phí) - wget. Wget là một trình tải xuống dòng lệnh rất thú vị cho môi trường Linux và UNIX cũng đã được chuyển sang Windows và macOS. Đừng để bị lừa bởi thực tế rằng nó là một công cụ dòng lệnh. Nó rất mạnh mẽ và linh hoạt và có thể phù hợp với một số trình tải xuống đồ họa tốt nhất hiện nay. Nó có các tính năng như tiếp tục tải xuống, kiểm soát băng thông, nó có thể xử lý xác thực và hơn thế nữa. Tôi sẽ giúp bạn bắt đầu với những điều cơ bản của việc sử dụng wget và sau đó tôi sẽ chỉ cho bạn cách bạn có thể tự động hóa một bản sao lưu hoàn chỉnh trang web của mình bằng cách sử dụng wget và cron .
Hãy bắt đầu bằng cách cài đặt wget. Hầu hết các bản phân phối Linux đều được cài đặt sẵn wget. Nếu bạn quản lý để hạ cánh cho mình một máy Linux mà không có bản sao của wget, hãy thử cách sau. Trên hệ thống dựa trên Red Hat Linux như Fedora, bạn có thể sử dụng:
# yum cài đặt wget
hoặc nếu bạn sử dụng hệ thống dựa trên Debian như Ubuntu:
# sudo apt-get install wget
Một trong những điều trên sẽ làm thủ thuật cho bạn. Nếu không, hãy kiểm tra hướng dẫn sử dụng bản phân phối Linux của bạn để xem cách tải và cài đặt các gói. Người dùng trên Windows có thể truy cập wget qua trang web này và đối với người dùng Mac, chúng tôi có hướng dẫn đầy đủ về cách cài đặt wget trong macOS.
Thao tác cơ bản nhất mà trình quản lý tải xuống cần thực hiện là tải tệp xuống từ một URL. Đây là cách bạn sẽ sử dụng wget để tải tệp xuống:
# wget https://www.simplehelp.net/images/file.zip
Vâng, đơn giản vậy thôi. Bây giờ hãy làm điều gì đó thú vị hơn. Hãy tải xuống toàn bộ trang web. Đây là một trải nghiệm về sức mạnh của wget. Nếu bạn muốn tải xuống một trang web, bạn có thể chỉ định độ sâu mà wget phải tìm nạp tệp từ đó. Giả sử bạn muốn tải xuống các liên kết cấp đầu tiên của trang chủ của Yahoo !. Đây là cách thực hiện điều đó:
# wget -r -l 1 https://www.yahoo.com/
Đây là những gì mỗi tùy chọn làm. -r kích hoạt truy xuất đệ quy các tệp. -l là viết tắt của cấp và số 1 bên cạnh nó cho biết có bao nhiêu cấp độ sâu để đi trong khi tìm nạp các tệp. Hãy thử tăng số lượng cấp độ lên hai và xem thời gian hoạt động lâu hơn.
Bây giờ nếu bạn muốn tải xuống tất cả các hình ảnh “jpeg” từ một trang web, người dùng quen thuộc với dòng lệnh Linux có thể đoán rằng một lệnh như “wget https://www.sevenacross.com*.jpeg” sẽ hoạt động. Thật không may, nó sẽ không. Những gì bạn cần làm là một cái gì đó như sau:
# wget -r -l1 –no-parent -A.jpeg https://www.yahoo.com
Một tùy chọn rất hữu ích khác trong wget là tiếp tục tải xuống. Giả sử bạn bắt đầu tải xuống một tệp lớn và bạn bị mất kết nối Internet trước khi quá trình tải xuống có thể hoàn tất. Bạn có thể sử dụng -c tùy chọn để tiếp tục tải xuống từ nơi bạn đã để lại.
# wget -c https://www.example_url.com/ubuntu-live.iso
Bây giờ, hãy chuyển sang thiết lập bản sao lưu hàng ngày của một trang web. Lệnh sau sẽ tạo một bản sao của một trang web trong đĩa cục bộ của bạn. Vì mục đích này, wget có một tùy chọn cụ thể, –mirror . Hãy thử lệnh sau, thay thế Sevenacross.com bằng địa chỉ trang web của bạn.
# wget –mirror https://www.sevenacross.com/
Khi lệnh chạy xong, bạn sẽ có một bản sao cục bộ của trang web của mình. Điều này làm cho một công cụ khá tiện dụng để sao lưu. Hãy biến lệnh này thành một tập lệnh shell thú vị và lên lịch chạy vào lúc nửa đêm mỗi đêm. Mở trình soạn thảo văn bản yêu thích của bạn và nhập nội dung sau. Hãy nhớ điều chỉnh đường dẫn của bản sao lưu và URL của trang web theo yêu cầu của bạn.
#! / bin / bash
YEAR =`date +”% Y ”`
MONTH =`date +”% m ”`
DAY =`date +”% d ”`BACKUP_PATH =`/ home / backup /` # thay thế đường dẫn bằng thư mục sao lưu của bạn
WEBSITE_URL =`https:// www.sevenacross.net` # thay url bằng địa chỉ của trang web bạn muốn sao lưu# Tạo và chuyển đến thư mục sao lưu
cd $ BACKUP_PARENT_DIR / $ YEAR / $ MONTH
mkdir $ DAY
cd $ DAYwget –mirror $ {WEBSITE_URL}
Bây giờ, hãy lưu tệp này dưới dạng một cái gì đó giống như website_backup.sh và cấp cho nó quyền thực thi:
# chmod + x website_backup.sh
Mở cấu hình cron của bạn bằng crontab và thêm dòng sau vào cuối:
0 0 * * * /path/to/website_backup.sh
Bạn sẽ có một bản sao trang web của mình sau / home / backup / YEAR / MONTH / DAY Hằng ngày. Để được trợ giúp thêm về cách sử dụng cron và crontab, hãy xem hướng dẫn này.
Bây giờ bạn đã có những kiến thức cơ bản về tải tệp xuống từ dòng lệnh, bạn có thể tham gia vào nội dung nâng cao bằng cách đọc trang người dùng của wget - chỉ cần nhập man wget từ dòng lệnh.