gpt4 book ai didi

html - 从网站中提取类似读者 View 的内容的规则?

转载 作者:搜寻专家 更新时间:2023-10-31 23:23:11 25 4
gpt4 key购买 nike

我正在尝试实现我自己的小型阅读器 View 应用程序(一个与 safari 上的阅读器模式功能相同的应用程序),我发现有几件事要问自己:

  • 是否有此功能的技术术语(读者 View 并没有真正削减它)?
  • 是否有网站应该遵循的标准,以表明他们希望在读者 View 中显示的内容
  • 是否有一组开源的 HTML 解析规则来从网站中提取“可读”内容?
  • 在几周内实现这样一个东西的工作量对于一个人来说是否太大了?如果是这样,我应该选择 Instaparser 等服务吗?

最佳答案

我相信最初是由arc90实现的,他们称之为可读性。您可以查看他们的页面 here .

随着时间的推移,它已被移植到许多不同的语言中,因此您可以查看不同的实现以了解更多关于它的信息、它是如何完成的等等。

这只是一个小示例,如果您想查找更多示例,还有更多示例。

编辑:哎呀,再谷歌搜索后我发现this question有一个很好地解释它的答案。

关于html - 从网站中提取类似读者 View 的内容的规则?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36455668/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com