java - 访问历史记录中上一页的 webelement 会引发错误-6ren

java - 访问历史记录中上一页的 webelement 会引发错误

转载作者：太空宇宙更新时间：2023-11-04 10:01:53

我有一个需要抓取 4 层嵌套页面的网站。

Level 1
    --->Level 2
        --->Level 3
            --->Level 4
        --->Level 3
            --->Level 4
    --->Level 2

因此，我必须来回访问每个级别 4、每个级别 3、每个级别 2、每个级别 1。

因此，我创建了嵌套循环

List<WebElement> chapters = driver.findElements(By.xpath("/html[1]/body[1]/div[2]/div[1]/div[4]/div[3]/div[1]/div[1]/table[1]/tbody[1]/tr[*]/td[3]/a"));
        for(WebElement chapter: chapters)
        {
            String chapter_name = chapter.getText();
            String chapter_url = chapter.getAttribute("href");

            System.out.println("CHAPTER : " + chapter_name + "URL : " + chapter_url);
            driver.get(chapter_url);

            List<WebElement> topics = driver.findElements(By.xpath("/html[1]/body[1]/div[2]/div[1]/div[4]/div[3]/div[1]/div[1]/table[1]/tbody[1]/tr[*]/td[3]/a"));
            for(WebElement topic: topics)
            {
                String topic_name = topic.getText();
                String topic_url = topic.getAttribute("href");

                System.out.println("\tTOPIC : " + topic_name +  "URL : " + topic_url);
                driver.get(topic_url);
                List<WebElement> sub_topics = driver.findElements(By.xpath("/html[1]/body[1]/div[2]/div[1]/div[4]/div[3]/div[1]/div[1]/table[1]/tbody[1]/tr[*]/td[3]/a"));
                for(WebElement sub_topic : sub_topics)
                {
                    String sub_topic_name = sub_topic.getText();
                    String sub_topic_url = sub_topic.getAttribute("href");

                    System.out.println("\t\tSUBTOPIC : " + sub_topic_name + "URL : " + sub_topic_url);
                    driver.get(sub_topic_url);
                    List<WebElement> problems = driver.findElements(By.xpath("/html[1]/body[1]/div[2]/div[1]/div[4]/div[3]/div[1]/div[1]/table[1]/tbody[1]/tr[*]/td[3]/a"));
                    for(WebElement problem : problems)
                    {
                        System.out.println("\t\t\t"+problem.getText());
                    }
                    driver.navigate().back();
                }
                driver.navigate().back();
            }
            driver.navigate().back();
        }

但我遇到以下异常:

Exception in thread "main" org.openqa.selenium.NoSuchElementException: Web element reference not seen before: dcbb0aef-d165-4450-964c-535fc4577f69
For documentation on this error, please visit: http://seleniumhq.org/exceptions/no_such_element.html
Build info: version: '3.14.0', revision: 'aacccce0', time: '2018-08-02T20:05:20.749Z'
System info: host: 'workstation', ip: '127.0.1.1', os.name: 'Linux', os.arch: 'amd64', os.version: '4.15.0-39-generic', java.version: '1.8.0_181'
Driver info: org.openqa.selenium.firefox.FirefoxDriver
Capabilities {acceptInsecureCerts: true, browserName: firefox, browserVersion: 63.0.3, javascriptEnabled: true, moz:accessibilityChecks: false, moz:geckodriverVersion: 0.23.0, moz:headless: false, moz:processID: 13651, moz:profile: /tmp/rust_mozprofile.gx46rW..., moz:useNonSpecCompliantPointerOrigin: false, moz:webdriverClick: true, pageLoadStrategy: normal, platform: LINUX, platformName: LINUX, platformVersion: 4.15.0-39-generic, rotatable: false, setWindowRect: true, timeouts: {implicit: 0, pageLoad: 300000, script: 30000}, unhandledPromptBehavior: dismiss and notify}
Session ID: 55d3e16e-5920-414d-b047-a24f5483a2c7
    at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
    at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
    at java.lang.reflect.Constructor.newInstance(Constructor.java:423)
    at org.openqa.selenium.remote.http.W3CHttpResponseCodec.createException(W3CHttpResponseCodec.java:187)
    at org.openqa.selenium.remote.http.W3CHttpResponseCodec.decode(W3CHttpResponseCodec.java:122)
    at org.openqa.selenium.remote.http.W3CHttpResponseCodec.decode(W3CHttpResponseCodec.java:49)
    at org.openqa.selenium.remote.HttpCommandExecutor.execute(HttpCommandExecutor.java:158)
    at org.openqa.selenium.remote.service.DriverCommandExecutor.execute(DriverCommandExecutor.java:83)
    at org.openqa.selenium.remote.RemoteWebDriver.execute(RemoteWebDriver.java:548)
    at org.openqa.selenium.remote.RemoteWebElement.execute(RemoteWebElement.java:276)
    at org.openqa.selenium.remote.RemoteWebElement.getText(RemoteWebElement.java:160)
    at firstTest.Getlinks.main(Getlinks.java:52)

这可能是因为向后导航可能会刷新并且状态会丢失。这种情况下的解决方案/最佳实践是什么？

最佳答案

这绝对是向后导航。每次您向后导航时，您都会看到一个新页面，并且以前存储的元素不再可交互。我注意到您的所有 xPath 都将获取链接(顺便说一句，它们是相似的)，因此我修改了可能会解决您的问题的代码:

private static final By XPATH = By.xpath("/html[1]/body[1]/div[2]/div[1]/div[4]/div[3]/div[1]/div[1]/table[1]/tbody[1]/tr[*]/td[3]/a");

    public void testMethod() {
        List<WebElement> chapters = driver.findElements(XPATH);
        List<String> chapterTexts = getTextsFromElements(chapters);

        scanChapters(chapterTexts);
    }

    private List<String> getTextsFromElements(List<WebElement> els) {
        List<String> texts = new ArrayList<>();
        for (WebElement el : els) {
            texts.add(el.getText());
        }
        return texts;
    }

    private void scanChapters(List<String> chapterTexts) {
        for (String chapterText : chapterTexts) {
            WebElement chapter = driver.findElement(By.linkText((chapterText)));
            String chapter_url = chapter.getAttribute("href");
            System.out.println("CHAPTER : " + chapterText + "URL : " + chapter_url);
            driver.get(chapter_url);

            List<WebElement> topics = driver.findElements(XPATH);
            List<String> topicTexts = getTextsFromElements(topics);
            scanTopics(topicTexts);

            driver.navigate().back();
        }
    }

    private void scanTopics(List<String> topicTexts) {
        for (String topicText : topicTexts) {
            WebElement topic = driver.findElement(By.linkText((topicText)));
            String topic_url = topic.getAttribute("href");
            System.out.println("\tTOPIC : " + topicText + "URL : " + topic_url);
            driver.get(topic_url);

            List<WebElement> sub_topics = driver.findElements(XPATH);
            List<String> subTopicTexts = getTextsFromElements(sub_topics);
            scanSubTopics(subTopicTexts);

            driver.navigate().back();
        }
    }

    private void scanSubTopics(List<String> subTopicTexts) {
        for (String subTopicText : subTopicTexts) {
            WebElement subTopic = driver.findElement(By.linkText((subTopicText)));
            String sub_topic_url = subTopic.getAttribute("href");
            System.out.println("\t\tSUBTOPIC : " + subTopicText + "URL : " + sub_topic_url);
            driver.get(sub_topic_url);

            List<WebElement> problems = driver.findElements(XPATH);
            for (WebElement problem : problems) {
                System.out.println("\t\t\t" + problem.getText());
            }

            driver.navigate().back();
        }
    }

关于java - 访问历史记录中上一页的 webelement 会引发错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53362801/

文章推荐： linux - CentOS配置Nginx加载Laravel 5.8 Site

文章推荐： linux - 使用cython将多个python模块构建成一个程序

文章推荐： java - 使用循环创建二维数组

OpenTelemetry实践指南：历史、架构与基本概念
背景之前陆续写过一些和 OpenTelemetry 相关的文章：实战：如何优雅的从 Skywalking 切换到 OpenTelemetry 实战：如何编写一个 OpenTeleme
Powershell PSReadLine 历史
我很困惑PSReadLine历史在 Powershell 中跨 session 工作。我可以在 PS 版本 5.1 中看到我以前的命令历史记录自动存储在 %userprofile%\AppData\R
symfony - 教义实体……历史？
我有一个实体，我正在从面板中保存我们的数据库，您可以在其中执行常规操作(编辑、添加等)。不是很大，大多数时候大约有 1k 行，而且这个数字可能总是在这个左右。该实体有一些与其他实体相关的字段(例如:位
aem - CQ5是否存储crx的修改列表(历史)？
有时有人想直接在环境中更改 crx 中的内容。这通常是环境不工作状态的原因。而且往往很难找到问题的原因。而且我认为如果 cq5 crx 有审计日志会很有帮助。像这样。 12.12.12 21:03
sql - 历史/可审核的数据库
这个问题与可以在其他问题之一中找到的模式有关here.基本上在数据库中，我存储用户，位置，传感器等。所有这些内容都可以由用户在系统中编辑，并且可以删除。但是-在编辑或删除项目时，我需要存储旧数据；我
mysql - 历史/审计表的设计建议
我需要随时跟踪许多项目及其状态。例子 ItemId Location DateTime State 1 Mall A 2010-02-03 07:00 on
Android - fragment 历史
我有这个方法来添加 fragment : public void addFragmentOnTop(Fragment fragment) { getSupportFragmentManager()
javascript 历史 onpopstate
我想了解 HTML5 历史对象。这是我开始的一个简单示例。 function addDialog(){ document.getElementById('d').style.
HTML5 历史 API
我如何使用 HTML5 history api。我确实通过了https://developer.mozilla.org/en/DOM/Manipulating_the_browser_history
database - 表修订/历史？
我正在尝试找出在关系数据库中保存表的历史记录/修订的最佳方法。我进行了一些研究和阅读，但不确定跟踪更改的最佳方式是什么。对于我的主表，我很确定我已经确定了一个修订表，以保持跟踪(见图)，但我不确定是
源代码行的 git 历史
这个问题在这里已经有了答案: Git: discover which commits ever touched a range of lines (6 个答案) 关闭 9 年前。我一直在研究 gi
linux - 常驻内存使用的概述/历史
我有一个相当复杂的程序(带有 SWIG'ed C++ 代码的 Python，长期运行的服务器)，它显示了不断增长的常驻内存使用量。我一直在使用常用的泄漏工具(valgrind、Pythons gc 模
Git 历史 - 通过关键字查找丢失的行
我的 Git 存储库中有一行包含单词“Foo”的数百次提交。是否有任何方法可以在上次的位置找到它的修订号？最佳答案这可以通过 -S 的镐 ( gitlog ) 选项来解决。 git log -
git - 如何取消删除git中的文件并保留他原来的 blame 历史？
我不小心删除了一个文件(我不是他的创建者)并提交并将其推送到远程。现在我想让 git 取消删除此更改，但是当我使用 git revert #mistaken commit 时，它可以工作，但指责信息指
Spyder 历史 Pane 问题
我使用 spyder 历史 Pane 查看我过去尝试过的命令，但最近我注意到它不会在我键入命令时更新。屏幕截图 1 显示了控制台和历史记录 Pane ，因为您可以看到历史记录中没有显示任何控制台条目。
history - 如何清理 Camunda 历史
我的应用程序使用 Camunda 7.7 运行。到目前为止，所有数据都保存在 Camunda 表 (ACT_XXX) 中——它们变得很大。所以现在我想清理表格并配置 Camunda，以便在 14 天后
git - 如何从不相关的存储库中 merge 历史
我在 SVN 上有一个这样组织的旧项目: /一些/子目录/a/trunk/foo /一些/子目录/b/trunk/foo /一些/子目录/c/trunk/foo 我使用GitHub工具git-impo
gnuradio - GNU Radio 历史
我有一个通用的工作功能，为此我将使用 GNU Radio 的历史记录功能。在 block 的构造函数中，我调用了 set_history( m )。我以标准方式转换输入缓冲区: const flo
javascript - 改变 JavaScript 历史
当我加载 php 页面时，我会附加一些数据。例如 MyPage.php?value=something。正如预期的那样，当我使用后退按钮来回移动时，它总是会加载附加的相同数据。我不想那样。我希望在页面
SVN:供应商分支+补丁+历史？
我们有一个相当大的库，我们需要定期将其导入(然后修补)到我们的代码库中。 SVN Book 似乎推荐了一个“vendor branch”方案，我们保留了“vendor drops”的补丁版本。这会起作

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 访问历史记录中上一页的 webelement 会引发错误