gpt4 book ai didi

java - 使用小程序减少 HTML

转载 作者:可可西里 更新时间:2023-11-01 12:48:20 29 4
gpt4 key购买 nike

我的主管指派我通过查看 HTML 标签以仅显示核心内容的方式以编程方式减少网站内容。重要的是,项目的这个特定部分必须用 Java 编写。

现在了解了插件、扩展、小程序和小部件之间的区别我认为我想使用调用客户端小程序的扩展。我的方法是这样的:

  1. 使用 Google-Chrome API,我打算显示一个按钮用户可以点击。
  2. 如果单击,操作是启动一个新的浏览器选项卡,该选项卡具有嵌入其中的小程序。
  3. 小程序自动获取被调用选项卡的 HTML 代码和过滤它。
  4. 过滤后,将显示原始网站的缩减副本。

所以我有几个问题。首先,是否可以将扩展与 Applet 一起使用?此外,小程序是否可以查看@另一个选项卡的 HTML 代码?如果没有,是否可以重新加载现在嵌入了 Applet 的原始选项卡并完成该功能。谢谢。

最佳答案

Javascript 已经在大多数移动网络平台上使用。 Java 不是,并且没有合理的方式让移动客户能够安装 Java。运行许多但不是所有移动设备的 Android 具有 Java 运行时环境,并且基本上是 Java 应用程序的加载器。但是 Apple iPhone 不是 Android 设备……Windows Phone 也不是。

如果你想在客户端和 Javascript 中总结内容,在我看来你有两种选择:

  1. 凭借内在的天才爆发取得成功,其中数十位自然语言计算领域最优秀的专家博士刚刚开始探索如何从文本中提取“真正的含义”;或者
  2. 查看document.title并完成它。

第二种方法假设网页的作者设置标题并设置一个适合总结他们网站的标题。这不是一个完美的假设,但没关系大多数时候。它也比#1 便宜很多

通过第一种方法,您可以先从“自然语言工具包”开始,该工具包可以执行诸如扫描文本中不常见的单词和短语之类的操作。要大致了解在该领域构建的软件种类,请查看 wikipedia: Outline of natural language processing:: toolkits .一个流行的 python 工具称为 NLTK .无论您使用来自 java 还是 python 的工具包,这都意味着在服务器上工作,因为客户端将没有存储、网络速度或 CPU。对于 python,有服务器端应用程序框架,如 django 或 web2py,可以更快地构建服务器应用程序,而在 Java 上有 servlets 框架。最终,您将需要大量帮助、培训或运气,正如我在上面暗示的那样,这很容易超出一小部分新员工的能力,当然也远远超出了单个新开发人员急于证明自己的能力在有限的帮助下,能力可以在几周内自行完成。

大多数网页在下载的 HTML 开头附近都有这样的标题设置:

<head><title>My Furry Kittens!</title></head>

您不需要编写解析器。如果您在浏览器中运行,则标题已经被解析为 DOM 或文档对象模型。字符串 "My Furry Kittens!"在这个例子中将在全局变量 document.title 中可用.

如果你愿意,你可以在插件中放一个按钮,让人们按下它来总结网站。或者,他们可以只看标题。它已经在页面上了。当然,如果目标是抓取标题,可以避免编写解析器并使用“假的” headless 可编写脚本的浏览器,如 phantomJS 或类似浏览器。

您可以阅读更多关于 document.title 的信息在 Mozilla Developer Network 上. MDN 是学习 Web 浏览器工作原理的绝佳引用。他们是 Mozilla Firefox 浏览器的维护者。您在那里学到的大部分内容也适用于 Chrome、Internet Explorer 和各种移动平台。

祝你好运!

关于java - 使用小程序减少 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22602366/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com