Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để sử dụng Biểu thức chính quy Python để trích xuất URL từ một liên kết HTML?


Đoạn mã sau trích xuất url từ liên kết html bằng cách sử dụng python regex

Ví dụ

import re
s = '''https://www.santa.com'''
match = re.search(r'href=[\'"]?([^\'" >]+)', s)
if match:
    print match.group(0)

Đầu ra

Điều này cho kết quả

href="https://www.santa.com"