Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để xác thực URL bằng một biểu thức chính quy trong Python?


Không có phương pháp xác thực nào vì hầu hết mọi thứ đều là URL hợp lệ. Có một số quy tắc về dấu câu để tách nó ra. Không có bất kỳ dấu chấm câu nào, bạn vẫn có một URL hợp lệ.

Tùy từng trường hợp, chúng tôi sử dụng các phương pháp sau.

  • Nếu bạn tin tưởng vào dữ liệu và chỉ muốn xác minh xem giao thức có phải là HTTP hay không, thì urlparse là hoàn hảo.

  • Nếu bạn muốn làm cho URL thực sự là một URL đúng, hãy sử dụng regex rườm rà và điên rồ

  • Nếu bạn muốn chắc chắn rằng đó là một địa chỉ web thực, hãy sử dụng mã sau

Ví dụ

import urllib
try:
    urllib.urlopen(url)
except IOError:
    print "Not a real URL"