Không có phương pháp xác thực nào vì hầu hết mọi thứ đều là URL hợp lệ. Có một số quy tắc về dấu câu để tách nó ra. Không có bất kỳ dấu chấm câu nào, bạn vẫn có một URL hợp lệ.
Tùy từng trường hợp, chúng tôi sử dụng các phương pháp sau.
-
Nếu bạn tin tưởng vào dữ liệu và chỉ muốn xác minh xem giao thức có phải là HTTP hay không, thì urlparse là hoàn hảo.
-
Nếu bạn muốn làm cho URL thực sự là một URL đúng, hãy sử dụng regex rườm rà và điên rồ
-
Nếu bạn muốn chắc chắn rằng đó là một địa chỉ web thực, hãy sử dụng mã sau
Ví dụ
import urllib try: urllib.urlopen(url) except IOError: print "Not a real URL"