Selenium

Comment obtenir l'URL actuelle avec Selenium

Comment obtenir l'URL actuelle avec Selenium
Selenium est un outil de test de navigateur, d'automatisation Web et de grattage Web. Lorsque vous travaillez sur vos projets Selenium, vous devrez peut-être connaître l'URL de la page affichée par votre navigateur Web contrôlé par Selenium. Ces informations peuvent être utiles pour garder une trace de l'URL d'où vous avez extrait certaines données afin que vous puissiez mettre à jour les données automatiquement à l'aide d'un script.

Dans cet article, je vais vous montrer comment obtenir l'URL actuelle du navigateur avec Selenium. Alors, commençons.

Conditions préalables:

Pour essayer les commandes et exemples de cet article, vous devez avoir,

1) Une distribution Linux (de préférence Ubuntu) installée sur votre ordinateur.
2) Python 3 installé sur votre ordinateur.
3) PIP 3 installé sur votre ordinateur.
4) Python virtualenv package installé sur votre ordinateur.
5) Navigateurs Web Mozilla Firefox ou Google Chrome installés sur votre ordinateur.
6) Doit savoir comment installer le pilote Firefox Gecko ou le pilote Web Chrome.

Pour remplir les conditions 4, 5 et 6, veuillez lire mon article Introduction à Selenium avec Python 3 chez Linuxhint.com.

Vous pouvez trouver de nombreux articles sur les autres sujets sur LinuxHint.com. N'oubliez pas de les consulter si vous avez besoin d'aide.

Configuration d'un répertoire de projet :

Pour que tout reste organisé, créez un nouveau répertoire de projet URL-sélénium/ comme suit:

$ mkdir -pv sélénium-url/drivers

Naviguez vers le URL-sélénium/ répertoire du projet comme suit :

$ cd sélénium-url/

Créez un environnement virtuel Python dans le répertoire du projet comme suit :

$ virtualenv .venv

Activez l'environnement virtuel comme suit :

$ source .venv/bin/activer

Installez la bibliothèque Selenium Python dans votre environnement virtuel à l'aide de PIP3 comme suit :

$ pip3 installer le sélénium

Téléchargez et installez tous les pilotes Web requis dans le Conducteurs/ répertoire du projet. J'ai expliqué le processus de téléchargement et d'installation des pilotes Web dans mon article Introduction à Selenium avec Python 3. Si vous avez besoin d'aide, recherchez sur LinuxHint.com pour cet article.

J'utiliserai le navigateur Web Google Chrome pour la démonstration dans cet article. Je vais donc utiliser le Chromedriver binaire avec Selenium. Vous devriez utiliser le pilote de gecko binaire si vous souhaitez utiliser le navigateur Web Firefox.

Obtenir l'URL actuelle avec Selenium :

Créer un script Python ex01.py dans votre répertoire de projet et tapez les lignes de codes suivantes dedans.

à partir du pilote Web d'importation de sélénium
du sélénium.pilote Web.commun.clés importer des clés
options = pilote Web.Options Chrome()
options.sans tête = vrai
navigateur = pilote Web.Chrome(executable_path="./drivers/chromedriver", options=options)
le navigateur.obtenir("https://duckduckgo.com/")
imprimer (navigateur.URL_actuelle)
le navigateur.Fermer()

Une fois que vous avez terminé, enregistrez le ex01.py Script Python.

Ici, la ligne 1 et la ligne 2 importent tous les composants requis de la bibliothèque Python selenium.

La ligne 4 crée un objet Options Chrome et la ligne 5 active le mode sans tête pour le navigateur Web Chrome.

La ligne 7 crée un Chrome le navigateur objet en utilisant le Chromedriver binaire de la Conducteurs/ répertoire du projet.

La ligne 9 indique au navigateur de charger le duckduckgo.site web com.

La ligne 10 imprime l'URL actuelle du navigateur. Ici, le navigateur.URL_actuelle la propriété est utilisée pour accéder à l'URL actuelle du navigateur.

La ligne 12 ferme le navigateur.

Exécutez le script Python ex01.py comme suit:

$ python3 ex01.py

Comme vous pouvez le voir, l'URL actuelle (https://duckduckgo.com) est imprimé sur la console.

Dans l'exemple précédent, j'ai visité le site Web duckduckgo.com et imprimé l'URL actuelle sur la console. Cela renvoie l'URL de la page que nous visitons. Pas très chic car nous connaissons déjà l'URL de la page. Maintenant, recherchons quelque chose sur DuckDuckGo et essayons d'imprimer l'URL de la page de résultats de recherche sur la console.

Créer un script Python ex02.py dans votre répertoire de projet et tapez les lignes de codes suivantes dedans.

à partir du pilote Web d'importation de sélénium
du sélénium.pilote Web.commun.clés importer des clés
options = pilote Web.Options Chrome()
options.sans tête = vrai
navigateur = pilote Web.Chrome(executable_path="./drivers/chromedriver", options=options)
le navigateur.obtenir("https://duckduckgo.com/")
imprimer (navigateur.URL_actuelle)
searchInput = navigateur.find_element_by_id('search_form_input_homepage')
rechercheEntrée.send_keys('selenium hq' + Clés.ENTRER)
imprimer (navigateur.URL_actuelle)
le navigateur.Fermer()

Une fois que vous avez terminé, enregistrez le ex02.py Script Python.

Ici, les lignes 1-10 sont les mêmes que dans ex01.py. Donc, je ne les explique plus.

La ligne 12 trouve la zone de texte de recherche et la stocke dans le rechercheEntrée variable.

La ligne 13 envoie la requête de recherche QG de sélénium dans le rechercheEntrée zone de texte et appuie sur le clé à l'aide Clés.ENTRER.

Une fois la page de recherche chargée, le navigateur.URL_actuelle est utilisé pour accéder à l'URL actuelle mise à jour.

La ligne 15 imprime l'URL actuelle mise à jour sur la console.

La ligne 17 ferme le navigateur.

Exécutez le ex02.py Script Python comme suit :

$ python3 ex02.py

Comme vous pouvez le voir, le script Python ex02.py imprime 2 URL.

Le premier est l'URL de la page d'accueil du moteur de recherche DuckDuckGo.

La seconde est l'URL actuelle mise à jour après avoir effectué une recherche sur le moteur de recherche DuckDuckGo à l'aide de la requête QG de sélénium.

Conclusion:

Dans cet article, je vous ai montré comment obtenir l'URL actuelle du navigateur Web à l'aide de la bibliothèque Selenium Python. Maintenant, vous devriez pouvoir rendre vos projets Selenium plus intéressants.

Top 5 des produits de souris d'ordinateur ergonomiques pour Linux
L'utilisation prolongée de l'ordinateur provoque-t-elle des douleurs au poignet ou aux doigts? Vous souffrez de raideurs articulaires et devez constam...
Comment modifier les paramètres de la souris et du pavé tactile à l'aide de Xinput sous Linux
La plupart des distributions Linux sont livrées avec la bibliothèque "libinput" par défaut pour gérer les événements d'entrée sur un système. Il peut ...
Remappez les boutons de votre souris différemment pour différents logiciels avec X-Mouse Button Control
Peut-être que vous avez besoin d'un outil qui pourrait faire changer le contrôle de votre souris avec chaque application que vous utilisez. Si tel est...