Computer >> Máy Tính >  >> Lập trình >> Python

Làm thế nào để viết biểu thức chính quy Python để nhận tất cả các thẻ liên kết trong một trang web?


Đoạn mã sau trích xuất tất cả các thẻ trong chuỗi đã cho

Ví dụ

import re
rex = re.compile(r'[\<\>]')
l = "this is text1 <a href='irawati.com' target='_blank'>hi</a> this is text2"
print rex.findall(l)

Đầu ra

['<', '>', '<', '>']