- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我在 Python 2.7 中使用 selenium
。从网页上的搜索框中检索内容。搜索框动态检索结果并在框中显示结果。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import pandas as pd
import re
from time import sleep
driver = webdriver.Firefox()
driver.get(url)
df = pd.read_csv("read.csv")
def crawl(isin):
searchkey = driver.find_element_by_name("searchkey")
searchkey.clear()
searchkey.send_keys(isin)
sleep(11)
search_result = driver.find_element_by_class_name("ac_results")
names = re.match(r"^.*(?=(\())", search_result.text).group().encode("utf-8")
product_id = re.findall(r"((?<=\()[0-9]*)", search_result.text)
return pd.Series([product_id, names])
df[["insref", "name"]] = df["ISIN"].apply(crawl)
print df
相关部分代码可以在def crawl(isin):
searchkey
)。 sleep()
并等待内容显示在搜索框下拉字段 ac_results
中。insrefs
和names
。我希望它等待 WebElement ac_results
中的内容加载,而不是调用 sleep()
。
由于它将不断使用搜索框通过从列表中输入新的搜索词来获取新数据,因此也许可以使用 Regex 来识别 ac_results
中何时有与以前的内容。
有什么方法吗?请务必注意,搜索框中的内容是动态加载的,因此该函数必须识别 WebElement 中的某些内容已更改。
最佳答案
您需要申请 Explicit Wait概念。例如。 等待元素变为可见:
wait = WebDriverWait(driver, 10)
wait.until(EC.visibility_of_element_located((By.CLASS_NAME, 'searchbox')))
在这里,它会等待 10 秒,每 500 毫秒检查一次元素的可见性。
有一组内置的预期条件等待,也很容易编写您的 custom Expected Condition .
仅供引用,以下是我们在聊天中集思广益后的处理方式。我们引入了一个自定义预期条件,它会等待元素文本更改。它帮助我们确定新搜索结果出现的时间:
import re
import pandas as pd
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support.expected_conditions import _find_element
class text_to_change(object):
def __init__(self, locator, text):
self.locator = locator
self.text = text
def __call__(self, driver):
actual_text = _find_element(driver, self.locator).text
return actual_text != self.text
#Load URL
driver = webdriver.Firefox()
driver.get(url)
#Load DataFrame of terms to search for
df = pd.read_csv("searchkey.csv")
#Crawling function
def crawl(searchkey):
try:
text_before = driver.find_element_by_class_name("ac_results").text
except NoSuchElementException:
text_before = ""
searchbox = driver.find_element_by_name("searchbox")
searchbox.clear()
searchbox.send_keys(searchkey)
print "\nSearching for %s ..." % searchkey
WebDriverWait(driver, 10).until(
text_to_change((By.CLASS_NAME, "ac_results"), text_before)
)
search_result = driver.find_element_by_class_name("ac_results")
if search_result.text != "none":
names = re.match(r"^.*(?=(\())", search_result.text).group().encode("utf-8")
insrefs = re.findall(r"((?<=\()[0-9]*)", search_result.text)
if search_result.text == "none":
names = re.match(r"^.*(?=(\())", search_result.text)
insrefs = re.findall(r"((?<=\()[0-9]*)", search_result.text)
return pd.Series([insrefs, names])
#Run crawl
df[["Insref", "Name"]] = df["ISIN"].apply(crawl)
#Print DataFrame
print df
关于python - Selenium:等到 WebElement 中的文本发生变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30964922/
下面的代码旨在在首次打开工作簿时运行。 Sub Auto_Open() Dim LastRow As Integer LastRow = Sheet6.UsedRange.Rows.Count Act
当我尝试操作我的代码时,除了弹出调试错误外,它执行得很好。错误信息在这里。 我的完整代码在这里。 #include using namespace std; class String { publi
The invocation of the constructor on type 'WpfApplication1.MainWindow' that matches the specified bi
我正在使用 BaseAdapter: public class MyAdapter extends BaseAdapter{ private final LayoutInflater mInflate
我想做网页抓取。我写了代码 var connection = require('./mysqlConnection'); var c = new Crawler({ maxConnections
我的系统中发生 Java 堆空间错误。我尝试了很多来自 Stack Overflow 的解决方案,但没有任何效果。当我工作时 当按下 OK 然后 (我的项目没有错误) 我的 eclipse.ini 是
环境: i5 750 DDR3 4GWin7 专业版 x64 sp1 DXSDK 9.0c 2010 年 6 月 GeForce GT240(驱动程序 275.33)512MB MSVC 2008 s
这段代码是我写的。 import socket host = 'localhost' port = 3794 s = socket.socket(socket.AF_INET, socket.SOCK
我正在尝试引用 UTC 时间间隔获取本地日期时间,我正在执行下面的代码。 var dtString =DateTime.UtcNow.ToString(@"yyyy-MM-ddTHH\:mm\:ss
我有一个非常简单的 C# 问题,它从库中加载 Windows WPF 窗口。这是代码: public partial class App : Application { public App(
我目前正在使用带有导航组件的底部导航,它工作正常但是当我们点击导航项 fragment 正在加载然后闪烁正在发生,即使当前选择的项目也会发生闪烁。它在加载 fragment 时发生。我的应用程序屏幕背
我是新来的 kotlin , 当我开始 Null Safety 时,我对下面的情况感到困惑. There's some data inconsistency with regard to initia
我有一个框,其中包含同时发生的两个独立的 css 转换。 当转换发生时,图标下方的标题和段落文本移动位置 参见 JS Fiddle:http://jsfiddle.net/Lsnbpt8r/ 这是我的
在为黑莓 10 构建电话间隙应用程序时,我遇到了异常情况。 [BUILD] Populating application source [BUILD] Parsing config.xml [
这个问题在这里已经有了答案: How to properly stop the Thread in Java? (8 个回答) 3年前关闭。 我看过How to properly stop the T
我试图弄清楚发生 fatal error 时如何刷新页面。基本上我正在访问图像 api 并将图像复制到我的服务器。我还每次都创建照片的缩略图版本。我会每隔一段时间收到一条错误消息,指出我的脚本试图分配
我正在尝试使用断言函数检查元素是否在屏幕上。我在我的测试应用程序 (AndroidDriver) 中使用 Appium 和 Java。我期望的是,如果元素在屏幕上,则返回 1;如果不在屏幕上,则返回
我正在开发图像上传系统。我使用 CommonsMultipartResolver 设置 maxUploadSize。当我尝试上传超过最大尺寸的图像文件时,会发生 MaxUploadSizeExcced
我有以下代码和@ComponentScan(basePackages = "com.project.shopping"),包结构为 com.project.shopping.Controller co
我尝试运行此程序作为测试,但收到错误“发生了 JNI 错误,请检查您的安装并重试”,然后是“发生了 Java 异常”。关于如何解决这个问题有什么想法吗? package java; public cl
我是一名优秀的程序员,十分优秀!