Computer >> Máy Tính >  >> Lập trình >> Python

URL xử lý các mô-đun Python (urllib)

Ngôn ngữ Python được sử dụng nhiều để lập trình web. Khi chúng tôi duyệt trang web, chúng tôi sử dụng địa chỉ web còn được gọi là URL hoặc bộ định vị tài nguyên thống nhất. Python có các tài liệu có sẵn có thể xử lý các lệnh gọi đến URL cũng như chuyển kết quả đến từ việc truy cập URL. Trong bài viết này, chúng ta sẽ thấy một mô-đun có tên là urllib . Chúng ta cũng sẽ thấy các chức năng khác nhau hiện diện trong mô-đun này giúp lấy kết quả từ URL.

Cài đặt urllib

Để cài đặt urllib trong môi trường python, chúng tôi sử dụng lệnh dưới đây bằng cách sử dụng pip.

 pip cài đặt urllib 

Chạy đoạn mã trên cho chúng ta kết quả sau -

Mở một URL

Phương thức request.urlopen được sử dụng để truy cập một URL và tìm nạp nội dung của nó vào môi trường python.

Ví dụ

 nhập urllib.requestaddress =urllib.request.urlopen ('https://www.tutorialspoint.com/') print (address.read ()) 

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

 b ' \ r \ n    \ r \ n   \ r \ n  \ r \ n  \ r \ n '-> 

urllib.parse

Chúng tôi có thể phân tích cú pháp URL để kiểm tra xem nó có phải là URL hợp lệ hay không. Chúng tôi cũng có thể Chuyển một chuỗi truy vấn đến tùy chọn tìm kiếm. Phản hồi có thể được kiểm tra tính hợp lệ của nó và chúng tôi có thể in toàn bộ phản hồi nếu nó là phản hồi hợp lệ.

Ví dụ

 import urllib.requestimport urllib.parseurl ='https://tutorialspoint.com'values={' q ':' python '} data =urllib.parse.urlencode (giá trị) data =data.encode (' utf- 8 ') # dữ liệu phải là byteprint (dữ liệu) req =urllib.request.Request (url, dữ liệu) resp =urllib.request.urlopen (req) print (resp) respData =resp.read () print (respData)  

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

 b'q =python ' b'  \ r \ n    \ r \ n  \ r \ n  

urllib.parse.urlsplit

urlsplit có thể được sử dụng để lấy một url, sau đó chia nó thành các phần có thể được sử dụng để thao tác dữ liệu tiếp theo. Ví dụ:nếu chúng tôi muốn đánh giá theo chương trình xem một URL có được chứng nhận SSL hay không thì chúng tôi áp dụng urlsplit và lấy giá trị lược đồ để quyết định. Trong ví dụ dưới đây, chúng tôi kiểm tra các phần khác nhau của URL được cung cấp.X

Đầu ra

 import urllib.parseurl ='https://tutorialspoint.com/python'value =urllib.parse.urlsplit (url) print (value) 

Chạy đoạn mã trên cho chúng ta kết quả sau -

 SplitResult (Scheme ='https', netloc ='tutorialspoint.com', path ='/ python', query ='', segment ='')