गूगल सर्च का उपयोग करके पायथन में एक सरल सार्वजनिक प्रॉक्सी पार्सर। हम इसका उपयोग करेंगे googlesearch-python
लाइब्रेरी में गूगल सर्च करने के लिए BeautifulSoup
HTML पार्सिंग के लिए.
सबसे पहले, सुनिश्चित करें कि आपके पास आवश्यक लाइब्रेरीज़ स्थापित हैं:
pip install beautifulsoup4 google
अब, आइए प्रॉक्सी पार्सर बनाएं:
from googlesearch import search
from bs4 import BeautifulSoup
import requests
def fetch_proxies():
proxies = []
# Perform a Google search for public proxy lists
query = "public proxy list"
for url in search(query, num=5, stop=5, pause=2):
# Fetch the HTML content of the search result
try:
response = requests.get(url, timeout=10)
if response.status_code == 200:
html_content = response.text
# Parse the HTML using BeautifulSoup
soup = BeautifulSoup(html_content, 'html.parser')
# Find proxy IP addresses and ports
for row in soup.find_all('tr'):
cols = row.find_all('td')
if len(cols) >= 2:
proxy = cols[0].text.strip() + ':' + cols[1].text.strip()
proxies.append(proxy)
except Exception as e:
print(f"Error fetching proxies from {url}: {e}")
return proxies
if __name__ == "__main__":
proxies = fetch_proxies()
for proxy in proxies:
print(proxy)
यह स्क्रिप्ट सार्वजनिक प्रॉक्सी सूचियों के लिए Google खोज करेगी, खोज परिणामों के HTML को पार्स करेगी, और प्रॉक्सी के IP पते और पोर्ट निकालेगी। कृपया ध्यान दें कि इस विधि का उपयोग करके प्राप्त प्रॉक्सी की गुणवत्ता और विश्वसनीयता भिन्न हो सकती है। इसके अतिरिक्त, हमेशा सुनिश्चित करें कि आप प्रॉक्सी का जिम्मेदारी से उपयोग करें और उन वेबसाइटों की सेवा की शर्तों का पालन करें जिन्हें आप उनके माध्यम से एक्सेस कर रहे हैं।
टिप्पणियाँ (0)
यहां अभी तक कोई टिप्पणी नहीं है, आप पहले हो सकते हैं!