gpt4 book ai didi

java - 获取页面的可见文本

转载 作者:IT老高 更新时间:2023-10-28 21:00:35 26 4
gpt4 key购买 nike

如何在没有 HTML 标签的情况下使用 selenium webdriver 获取网页的可见文本部分?

我需要与 Htmlunit 中的 HtmlPage.asText() 函数等效的东西。

仅使用函数 WebDriver.getSource 获取文本并使用 jsoup 解析它是不够的,因为页面中可能存在我对它们不感兴趣的隐藏元素(通过外部 CSS)。

最佳答案

执行 By.tagName("body") (或其他选择器来选择顶部元素),然后对该元素执行 getText() 将返回所有可见文本。

关于java - 获取页面的可见文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18336956/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com