Selenium je výkonný nástroj pro automatizaci interakcí webového prohlížeče. Tento článek vás provede instalací Selenium s Pythonem a používáním jeho základních funkcí. Probereme instalaci potřebných ovladačů, otevírání a procházení webových stránek, pořizování snímků obrazovky a další.
Proč používat selen s Pythonem?
Selen je široce používán pro automatizaci webu, protože podporuje více prohlížečů a programovacích jazyků. Zejména Python je oblíbený pro svou jednoduchost a čitelnost, díky čemuž je vynikající volbou pro začátečníky i zkušené vývojáře.
Krok 1: Instalace Selenium a webových ovladačů
Instalace selenu
Nejprve se ujistěte, že máte ve svém systému nainstalovaný Python. Selenium můžete nainstalovat pomocí pip:
pip install selenium
Instalace GeckoDriver a ChromeDriver
Selenium vyžaduje webový ovladač pro interakci s vybraným prohlížečem. Zde použijeme GeckoDriver pro Firefox a ChromeDriver pro Chrome.
- Stáhněte si GeckoDriver:
- Přejít na Stránka vydání GeckoDriver.
- Stáhněte si verzi, která odpovídá vašemu operačnímu systému.
- Rozbalte soubor a umístěte jej do adresáře, který je součástí cesty vašeho systému.
- Stáhněte si ChromeDriver:
- Navštivte Stránka ke stažení ChromeDriver.
- Vyberte vhodnou verzi pro svůj prohlížeč Chrome.
- Extrahujte soubor a přidejte jej do své PATH.
Přidání ovladače do PATH:
- Přesuňte soubor ovladače do požadovaného adresáře.
- Aktualizujte systémovou proměnnou prostředí PATH tak, aby zahrnovala tento adresář.
Příklad: Aktualizace PATH v systému Windows
- Klikněte pravým tlačítkem na
This PC
a vyberteProperties
. - Klikněte na
Advanced system settings
. - V okně Vlastnosti systému klikněte na
Environment Variables
knoflík. - Pod
System variables
, najítPath
proměnnou a upravit ji. - Přidejte úplnou cestu k adresáři obsahujícímu vaše webové ovladače.
Krok 2: Základní funkce v selenu
S nainstalovaným Selenium a potřebnými ovladači můžete začít automatizovat webové interakce. Níže jsou uvedeny některé základní operace, které můžete provádět se selenem.
Otevření prohlížeče
Chcete-li otevřít prohlížeč pomocí Selenium:
from selenium import webdriver
# Initialize the Firefox driver
driver = webdriver.Firefox()
# To use Chrome, initialize the Chrome driver
# driver = webdriver.Chrome()
Chcete-li přejít na webovou stránku, použijte get
metoda:
driver.get('https://www.example.com')
Pořízení snímku obrazovky
Můžete pořídit snímek obrazovky aktuálního okna prohlížeče:
driver.save_screenshot('screenshot.png')
Obnovení stránky
Chcete-li obnovit aktuální stránku:
driver.refresh()
Zavření prohlížeče
Až budete se svými úkoly hotovi, zavřete prohlížeč:
driver.quit()
Příklad kódu
Zde je úplný příklad, který demonstruje výše uvedené funkce:
from selenium import webdriver
import time
# Initialize the Firefox driver
driver = webdriver.Firefox()
# Navigate to a web page
driver.get('https://www.example.com')
# Wait for 5 seconds
time.sleep(5)
# Navigate to another page
driver.get('https://www.google.com')
# Take a screenshot
driver.save_screenshot('google_homepage.png')
# Refresh the page
driver.refresh()
# Close the browser
driver.quit()
Vložení tabulky do HTML pomocí selenu
Zde je příklad toho, jak můžete vytvořit a manipulovat s tabulkou pomocí Selenium:
# Navigate to a page with a table
driver.get('https://www.example.com/table')
# Extract table data
table = driver.find_element_by_id('table_id')
rows = table.find_elements_by_tag_name('tr')
data = []
for row in rows:
cols = row.find_elements_by_tag_name('td')
row_data = [col.text for col in cols]
data.append(row_data)
# Print the table data
for row in data:
print('\t'.join(row))
Závěr
Tato příručka vám představila instalaci Selenium a používání jeho základních funkcí s Pythonem. Všestrannost Selenium a snadné použití Pythonu z nich činí výkonnou kombinaci pro úkoly automatizace webu. Procvičte si tyto základy a budete na dobré cestě k efektivní automatizaci webových interakcí.
Komentáře (0)
Zatím zde nejsou žádné komentáře, můžete být první!