gpt4 book ai didi

c# - Selenium - 陈旧元素引用 : element is not attached to the page document in C#

转载 作者:行者123 更新时间:2023-11-30 14:25:34 25 4
gpt4 key购买 nike

我正在使用 selenium 获取网站表格中的数据以进行分析。我必须扫描并获得大约 ~1000 行的表格。

我知道页面有 Javascript,它会自动更新 DOM。但是表格行太多,所以当我扫描我的代码时总是抛出异常。

我试过这段代码:

Boolean breakIt = true;
List<IWebElement> result = new List<IWebElement>();
while (true)
{
breakIt = true;
try
{
IWebElement baseTable = browser.FindElementById("column2");
ReadOnlyCollection<IWebElement> rowsTable = baseTable.FindElements(By.XPath("id('oTable')/table/tbody/tr"));
foreach (IWebElement rows in rowsTable) {
if (rows.FindElements(By.XPath("td")).Count == 10)
result.Add(rows);
}
if (breakIt)
{
break;
}
}
catch (StaleElementReferenceException ser)
{
if (ser.Message.Contains("element is not attached"))
{
browser.Refresh();
browser.WaitForPageToLoad();
browser.GoToFrame(browser.FindElementByXPath("//*[@id='form1']/div[3]/iframe"));
breakIt = false;
}
}
}

它抛出如下异常:

Stale element reference: element is not attached to the page document.

有解决我的问题的想法吗?我认为使用多个 Thread 是最好的方法。

但我尝试使用多个 Thread 它也返回异常。

我想在得到 rowsTable.Count 之后。除此/2。并创建两个线程运行这个?

最佳答案

我也有类似情况。我的列表并不多,所以我将提出的一些想法不适用于我的案例,因此我没有测试它们。

多次扫描表格。

假设表定期更新,那么如果第一个表扫描因 StaleElementReferenceException 而失败,则第二个表扫描会在下一个静默期开始时立即开始,并且很有可能在下一次更新之前成功发生。前提是您可以比更新周期更快地完成扫描。

waitForAngular() 是来自 https://stackoverflow.com/a/30540634/6081394 的方法或来自 https://stackoverflow.com/a/38657507/6081394 ,或者一个接一个地使用两者以更加确定;)

var finished = false;
for (var i = 0; i < 10; i++)
{
try
{
waitForAngular()
// scan table here
finished = true;
break;
}
catch (StaleElementReferenceException e)
{
continue;
}
}
if (!finished)
{
// test flaked out
}

我自己做的。

在本地运行 Selenium。

Local selenium 比 Remote 快,所以使用以前的方法,您更有可能在页面更新之前完成表扫描。我知道这不现实,但仍然是一种选择。

多次扫描每个小范围的行。

如果表只是刷新,但数据(和行数)相同,可以先统计表中的行数,然后一次检查 10 行,如果 StaleElementReferenceException< 重试 和以前一样。

您可以使用 CSS 查询行范围,请参阅 https://stackoverflow.com/a/28061560/6081394

tr:nth-child(n+2):nth-child(-n+4)

注入(inject) JavaScript 片段并在那里进行检查。

JavaScript 执行是事件驱动的和单线程的。这保证了当您注入(inject)的 JavaScript 正在运行时,更新页面的脚本不会运行。但是,可能会发生的情况是当表处于更新中间时执行脚本。您必须检测到这一点,退出,再次运行脚本并希望下一次会更好。参见 https://stackoverflow.com/a/6285793/6081394举个例子。

如果我面对大表和快速更新,这就是我会追求的方式。

旁注

据我所知,selenium 驱动程序最终会在页面中执行 JavaScript 来完成它们的工作,并且该执行是单线程的,因为单个浏览器选项卡中的所有 JavaScript 执行都是单线程的。因此,您编写的任何多线程 C# 测试最终都会以序列化的顺序依次执行 Selenium 操作。所以多线程不是解决方案。

关于c# - Selenium - 陈旧元素引用 : element is not attached to the page document in C#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37781539/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com