Đoạn mã sau trích xuất url từ liên kết html bằng cách sử dụng python regex
Ví dụ
import re s = '''https://www.santa.com''' match = re.search(r'href=[\'"]?([^\'" >]+)', s) if match: print match.group(0)
Đầu ra
Điều này cho kết quả
href="https://www.santa.com"