Computer >> Máy Tính >  >> Lập trình >> HTML

Nhận nguồn HTML của WebElement trong Selenium WebDriver bằng Python.

Chúng tôi có thể lấy nguồn html của webelement bằng Selenium webdriver. Chúng tôi có thể lấy innerHTML để lấy nguồn của phần tử web.

InternalHTML là một thuộc tính của webelement bằng với văn bản nằm giữa thẻ bắt đầu và thẻ kết thúc. get_attribute phương thức được sử dụng cho việc này và innerHTML được chuyển làm đối số cho phương thức.

Cú pháp

s = element.get_attribute('innerHTML')

Chúng tôi có thể lấy nguồn html của webelement với sự trợ giúp của Javascript Executor. Chúng tôi sẽ sử dụng execute_script và chuyển đối số index.innerHTML webelement có nguồn html sẽ được truy xuất tới phương thức.

Cú pháp

s = driver.find_element_by_id("txt-search")
driver.execute_script("return arguments[0].innerHTML;",s)

Hãy cho chúng tôi xem mã html bên dưới của một phần tử. HTML bên trong của phần tử sẽ là - Bạn đang duyệt tài nguyên tốt nhất cho Giáo dục Trực tuyến .

Nhận nguồn HTML của WebElement trong Selenium WebDriver bằng Python.

Ví dụ

Triển khai mã với get_attribute.

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\\chromedriver.exe"
# implicit wait applied
driver.implicitly_wait(0.5)
driver.get("https://www.tutorialspoint.com/index.htm")
# to identify element and obtain innerHTML with get_attribute
l = driver.find_element_by_css_selector("h4")
print("HTML code of element: " + l.get_attribute('innerHTML'))

Triển khai mã với Trình thực thi Javascript.

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\\chromedriver.exe"
# implicit wait applied
driver.implicitly_wait(0.5)
driver.get("https://www.tutorialspoint.com/index.htm")
# to identify element and obtain innerHTML with execute_script
l = driver.find_element_by_css_selector("h4")
h= driver.execute_script("return arguments[0].innerHTML;",l)
print("HTML code of element: " + h)

Đầu ra

Nhận nguồn HTML của WebElement trong Selenium WebDriver bằng Python.