Computer >> Máy Tính >  >> Lập trình >> HTML

Truy cập mã nguồn HTML bằng Python Selenium.

Chúng ta có thể truy cập mã nguồn HTML bằng Selenium webdriver. Chúng tôi có thể nhờ sự trợ giúp của page_source và in giá trị thu được từ nó trong bảng điều khiển.

Cú pháp

src = driver.page_source

Chúng ta cũng có thể truy cập mã nguồn HTML với sự trợ giúp của các lệnh Javascript trong Selenium. Chúng tôi sẽ nhận sự trợ giúp của execute_script và chuyển lệnh return document.body.innerHTML như một tham số cho phương thức.

Cú pháp

h = driver.execute_script("return document.body.innerHTML;")

Ví dụ

Triển khai mã.

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://www.tutorialspoint.com/index.htm")
# access HTML source code with page_source method
s = driver.page_source
print(s)

Triển khai mã với Trình thực thi Javascript.

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://www.tutorialspoint.com/index.htm")
# access HTML source code with Javascript command
h = driver.execute_script("return document.body.innerHTML")
print(h)