javascript - 如何解析呈现的 HTML 中视觉上连贯的文本？-6ren

javascript - 如何解析呈现的 HTML 中视觉上连贯的文本？

转载作者：行者123 更新时间：2023-11-30 13:57:17

25

4

假设我们可以通过 Javascript 访问呈现的 DOM(例如加载页面时的开发人员控制台)。

我想以类似于我们人类视觉解释内容的方式从节点中提取文本。

例子:


<div>
  <span>This</span>
  <span>Text</span>
  <div>
    <span>belongs together</span>
  </div>
</div>

我的算法应该能够将这段文本识别为一个集群，如果它在视觉上是连贯的。

因此它应该输出:"This text belongs together" 而不是 ["this, "text", "belongs together"]

任何想法如何进行？

我考虑为每个文本节点计算 boundingRect 并应用一些以视口(viewport)尺寸作为引用点的聚类算法。

最佳答案

您使用边界矩形并将它们关联起来的想法很好。

此文件来自 Chrome，spatial_navigation.cc ，您可能会感兴趣。 “空间导航”是某些浏览器中的一项功能，其中焦点不按 Tab 键顺序移动，而是在上下左右空间中移动。它类似于您的问题，因为它在 DOM 上工作，但关心链接的显示方式，而不是 DOM 的结构。

如果您检查构建空间导航的基元，它们是:

边界矩形。
与视口(viewport)相交。
矩形是在另一个矩形的右侧还是下方。
是否有东西被遮挡。

从这些原语中可以构建出更高层次的东西。

关于与视口(viewport)相交的更多详细信息:视口(viewport)是呈现内容的区域。您可以使用 window.innerWidth 和 window.innerHeight 作为以像素为单位的视口(viewport)尺寸，并计算某些东西是否可见，累积它及其父级的布局和滚动偏移；或使用 Intersection Observers找出元素是否在视口(viewport)中。

关于模糊节点的更多细节:一般来说，检测模糊节点很困难。 display: none; 是一个简单的案例:这些节点的 innerWidth 和 innerHeight 均为 0。重叠的内容更难:检测内容如何碰撞和确定顶部内容的 z-index。最难的是近乎透明的内容，低对比度内容，以及经过严格过滤或转换的内容。

如果您遇到很多像这样棘手的情况，捕获屏幕并在其上执行 OCR 可能会更简单。这利用了浏览器的渲染管道来完成所有的转换和分层；你可以在图片中找到文字；等缺点是getDisplayMedia API 尚不能在所有浏览器中运行，它会通过提示打断用户。

您仍然可以从 OCR 算法中寻找灵感。 OCR 必须执行类似的问题:一旦识别出本地化字符，就必须将它们放入文本行中。

关于javascript - 如何解析呈现的 HTML 中视觉上连贯的文本？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57005892/

25

4

0

文章推荐： ios - 使用 NSPredicate 将对象保存到核心数据

文章推荐： javascript - 测试异步useEffect

文章推荐： c# - 在C#中实现牛顿万有引力定律

Javascript 呈现(访问者)和 html 呈现(机器人)。合法吗？搜索引擎优化
我有一个 aspx 应用程序。在每个 GET 中，服务器以包含除表格网格之外的所有内容的“基本”html 进行响应。这个“网格信息”包含在页面中隐藏的输入类型(json 格式)中。这是设计使然，无
ios - 呈现/呈现 View Controller 和父/ subview Controller 之间的交互是否在任何地方记录？
阅读有关 iOS 中 UIViewControllers 更改的文档，我试图弄清楚呈现模态视图 Controller 之间的交互如何在自定义容器 View Controller 内工作。最终，我希望能
ajax - 呈现 ClientBehaviorHolder
我正忙于编写自己的 JSF2 UIComponent 及其相关的渲染器。我所有的 UIComponent 都实现了 ClientBehaviorHolder。我不明白的是如何真正呈现 ClientBe
iphone - 呈现 UIPopoverviewcontroller
我正在开发一个使用UIPopoverController的应用程序，我在呈现该弹出窗口时遇到问题，我有一个添加在self.view上的UIView，并在该 View 上添加了一个表格 View ，该表
IOS 呈现 PageViewController
我有一个简单的应用程序，我想在用户首次登录应用程序时在其中显示一个 PageViewController。他们查看教程后，在下一次加载时不会显示 PageViewController。但是我收到了以
模型获取之前的主干.js View 呈现
我正在尝试制作一个小型的backbone.js 应用程序，但在事情的顺序上很挣扎。在我的 html 文件中，标题中有两个脚本 block : jQuery(function(){
atk4 - 呈现 radio 而不是复选框或表单中的选择列表
我有一个以模型为来源的表格: $form->setModel("test"); 在模型中，我们可以定义字段类型，例如:boolean 将在表单中制作复选框。现在我们如何定义呈现为单选按钮的类型？最
fabricJs 自定义对象不会从 JSON 呈现
fabricJS 版本 2.2.3 测试 jsFiddle 我正在尝试使用 LabeledRect 子类，但我的问题是，每当我尝试从 JSON 加载它时，它都不会呈现，并且在控制台中也没有出现错误。请
wpf - 呈现 UserControl.Resources
在我的 Xaml 中，我定义了一个资源作为 vehicleDataInput，它提供一些文本框供用户输入数据。如果我没有为它定义一个 x:Key ，它将在我的应用程序中出现并按其应有的方式工作。问题是
javascript - 呈现 HTML 符号
我在 React 中创建了一个 Symbol 组件来轻松呈现 HTML Symbols像 euro 这样的名字将呈现 €(€) 或 sum 呈现 ∑(∑). 问题是，如果我只渲染 HTML 代码，我将
grails - 呈现 View ，但gsp中没有对象
我尝试渲染一个 View ，该 View 工作正常，但似乎无法获得传递给它的模型对象。我不知道原因，因为根据所有手册和示例，这应该非常简单。模型对象 class Race { def dis
grails - Grails数据库操作和 View 呈现
我正在尝试为Grails项目添加一个简单功能，类似于youtube，它将允许用户喜欢/不喜欢文章。有一个非常原始的页面来显示带有喜欢的文章和一个使“喜欢”成为可能的 Controller 。 las，
iphone - 呈现 MFMailComposeViewController，但它在可见后立即消失
我的应用程序中的第一个 ViewController 子类 UIImagePickerController 然后通过 didFinishPickingMediaWithInfo 回调，我执行以下操作:
javascript - 为什么我的待办事项不使用 Redux 呈现？
我正在做一个简单的 redux/react todo 应用程序。我无法显示待办事项。我能够 console.log 数据，但无法显示它。我做错了什么？我把文件分开了，这是我的app.js: impo
ios - 呈现 navigationController 时出错
我正在尝试呈现一个导航 Controller ，它似乎可以工作并呈现导航 Controller 。但是，即使它有效，我仍然不断收到错误？我的代码 let vc = storyboard.instan
swift - 呈现 Controller 时呈现加载图像的延迟
我正在重新创建一个简单版本的 snapchat 应用程序，但遇到了一个恼人的小问题，我似乎无法找到解决办法。我查看了一些答案，例如 this one但没有运气。总体概念与 snapchat 用户单
swift - 呈现 UIAlert 时延迟较长
我在呈现警报时遇到问题。我正在使用 UIAlertController。当用户按下提交按钮时，在应用程序执行某些操作时，需要立即显示“请稍候..”的警报。操作完成后，警报将消失。尽管应该在我开始执行操
javascript - 图像不使用 KineticJS 呈现
我只是想用 Kinetic 渲染图像，但没有出现，也没有出现错误。可以找到 fiddle here . 源代码: $( function() { var stage = new Kineti
javascript - onLoadFinished 触发时页面未完全加载/呈现
我正在使用 Phantomjs 检查我的应用程序。我正在查看的页面包含很多组件，并且由 Angularjs 提供支持。我的测试服务器很慢。在 onLoadFinished 事件中，我使用渲染对网页进行
javascript - 呈现 XML 文档
我有一个变量，它的字符串包含我所有的文档，如下所示: var string = " ReportHelloWorld"; 我想打开一个正确插入和显示此报告的新页面，但不知道如何操作。我该怎么办？感谢

首页

博学

6Ren·AI

商城

javascript - 如何解析呈现的 HTML 中视觉上连贯的文本？