gpt4 book ai didi

python - Selenium:等到 WebElement 中的文本发生变化

转载 作者:太空狗 更新时间:2023-10-29 21:22:05 26 4
gpt4 key购买 nike

我在 Python 2.7 中使用 selenium。从网页上的搜索框中检索内容。搜索框动态检索结果并在框中显示结果。

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import pandas as pd
import re
from time import sleep

driver = webdriver.Firefox()
driver.get(url)

df = pd.read_csv("read.csv")

def crawl(isin):
searchkey = driver.find_element_by_name("searchkey")
searchkey.clear()
searchkey.send_keys(isin)
sleep(11)

search_result = driver.find_element_by_class_name("ac_results")
names = re.match(r"^.*(?=(\())", search_result.text).group().encode("utf-8")
product_id = re.findall(r"((?<=\()[0-9]*)", search_result.text)
return pd.Series([product_id, names])

df[["insref", "name"]] = df["ISIN"].apply(crawl)

print df

相关部分代码可以在def crawl(isin):

下找到
  • 程序在搜索框中输入要搜索的内容(该框的名称不正确 searchkey)。
  • 然后执行 sleep() 并等待内容显示在搜索框下拉字段 ac_results 中。
  • 然后用Regex得到两个变量insrefsnames

我希望它等待 WebElement ac_results 中的内容加载,而不是调用 sleep()

由于它将不断使用搜索框通过从列表中输入新的搜索词来获取新数据,因此也许可以使用 Regex 来识别 ac_results 中何时有与以前的内容。

有什么方法吗?请务必注意,搜索框中的内容是动态加载的,因此该函数必须识别 WebElement 中的某些内容已更改。

最佳答案

您需要申请 Explicit Wait概念。例如。 等待元素变为可见:

wait = WebDriverWait(driver, 10)
wait.until(EC.visibility_of_element_located((By.CLASS_NAME, 'searchbox')))

在这里,它会等待 10 秒,每 500 毫秒检查一次元素的可见性。

有一组内置的预期条件等待,也很容易编写您的 custom Expected Condition .


仅供引用,以下是我们在聊天中集思广益后的处理方式。我们引入了一个自定义预期条件,它会等待元素文本更改。它帮助我们确定新搜索结果出现的时间:

import re

import pandas as pd
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support.expected_conditions import _find_element

class text_to_change(object):
def __init__(self, locator, text):
self.locator = locator
self.text = text

def __call__(self, driver):
actual_text = _find_element(driver, self.locator).text
return actual_text != self.text

#Load URL
driver = webdriver.Firefox()
driver.get(url)

#Load DataFrame of terms to search for
df = pd.read_csv("searchkey.csv")

#Crawling function
def crawl(searchkey):
try:
text_before = driver.find_element_by_class_name("ac_results").text
except NoSuchElementException:
text_before = ""

searchbox = driver.find_element_by_name("searchbox")
searchbox.clear()
searchbox.send_keys(searchkey)
print "\nSearching for %s ..." % searchkey

WebDriverWait(driver, 10).until(
text_to_change((By.CLASS_NAME, "ac_results"), text_before)
)

search_result = driver.find_element_by_class_name("ac_results")
if search_result.text != "none":
names = re.match(r"^.*(?=(\())", search_result.text).group().encode("utf-8")
insrefs = re.findall(r"((?<=\()[0-9]*)", search_result.text)
if search_result.text == "none":
names = re.match(r"^.*(?=(\())", search_result.text)
insrefs = re.findall(r"((?<=\()[0-9]*)", search_result.text)
return pd.Series([insrefs, names])

#Run crawl
df[["Insref", "Name"]] = df["ISIN"].apply(crawl)

#Print DataFrame
print df

关于python - Selenium:等到 WebElement 中的文本发生变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30964922/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com