Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để chúng ta sử dụng các nhóm có tên Biểu thức chính quy trong Python?

Nhóm được đặt tên

Hầu hết các công cụ biểu thức chính quy hiện đại đều hỗ trợ các nhóm chụp được đánh số và tham chiếu ngược được đánh số. Các cụm từ thông dụng dài với nhiều nhóm và tham chiếu ngược có thể khó đọc và khó hiểu. Việc thêm hoặc xóa một nhóm chụp ở giữa regex sẽ làm xáo trộn số lượng của tất cả các nhóm theo sau nhóm đã thêm hoặc đã xóa.

Mô-đun re của Python là mô-đun đầu tiên đưa ra giải pháp:các nhóm thu thập được đặt tên và các tham chiếu ngược được đặt tên. (? P group) ghi lại trận đấu của nhóm vào "tên" tham chiếu ngược. tên phải là một chuỗi chữ và số bắt đầu bằng một chữ cái. nhóm có thể là bất kỳ biểu thức chính quy nào. Bạn có thể tham chiếu nội dung của nhóm với backreference được đặt tên (? P =name). Dấu hỏi, P, dấu ngoặc nhọn và dấu bằng đều là một phần của cú pháp. Mặc dù cú pháp cho backreference được đặt tên sử dụng dấu ngoặc đơn, nó chỉ là một backreference không thực hiện bất kỳ thao tác thu hoặc nhóm nào. Ví dụ về thẻ HTML có thể được viết là <(? P [A-Z] [A-Z0-9] *) \ b [^>] *>. *? .