Je pratique Selenium en Python et je voulais récupérer tous les liens sur une page Web en utilisant Selenium.
Par exemple, je veux tous les liens dans la href=
propriété de toutes les <a>
balises sur http://psychoticelites.com/
J'ai écrit un script et ça marche. Mais cela me donne l'adresse de l'objet. J'ai essayé d'utiliser la id
balise pour obtenir la valeur, mais cela ne fonctionne pas.
Mon script actuel:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Firefox()
driver.get("http://psychoticelites.com/")
assert "Psychotic" in driver.title
continue_link = driver.find_element_by_tag_name('a')
elem = driver.find_elements_by_xpath("//*[@href]")
#x = str(continue_link)
#print(continue_link)
print(elem)
Eh bien, vous devez simplement parcourir la liste:
elems = driver.find_elements_by_xpath("//a[@href]")
for elem in elems:
print(elem.get_attribute("href"))
find_elements_by_*
renvoie une liste d'éléments (notez l'orthographe des «éléments»). Parcourez la liste, prenez chaque élément et récupérez la valeur d'attribut que vous souhaitez (dans ce cas href
).
Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.
En cas d'infraction, veuillez [email protected] Supprimer.
laisse moi dire quelques mots