Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để thoát khỏi bất kỳ ký tự đặc biệt nào trong biểu thức chính quy Python?

Biểu thức chính quy sử dụng ký tự gạch chéo ngược ('\') để biểu thị các dạng đặc biệt hoặc để cho phép các ký tự đặc biệt được sử dụng mà không cần gọi ý nghĩa đặc biệt của chúng. Điều này xung đột với việc Python sử dụng cùng một ký tự cho cùng một mục đích trong chuỗi ký tự; ví dụ:để khớp với một dấu gạch chéo ngược theo nghĩa đen, người ta có thể phải viết '\\\\' dưới dạng chuỗi mẫu, vì biểu thức chính quy phải là \\ và mỗi dấu gạch chéo ngược phải được biểu thị bằng \\ bên trong một chuỗi Python thông thường.

Giải pháp là sử dụng ký hiệu chuỗi thô của Python cho các mẫu biểu thức chính quy; dấu gạch chéo ngược không được xử lý theo bất kỳ cách đặc biệt nào trong một chuỗi ký tự có tiền tố là 'r'. Vì vậy, r "\ n" là một chuỗi hai ký tự chứa '\' và 'n', trong khi "\ n" là một chuỗi một ký tự chứa một dòng mới. Thông thường các mẫu sẽ được thể hiện bằng mã Python bằng cách sử dụng ký hiệu chuỗi thô này.