gpt4 book ai didi

javascript - 如何像 Evernote clipper 那样检测文章的主要标签

转载 作者:太空狗 更新时间:2023-10-29 13:44:33 25 4
gpt4 key购买 nike

当我尝试使用 Evernote clipper extension 时,我看到一个非常有用的功能。当我点击“文章”时,它给了我一个真正正确的页面主要内容。让我们看看我在页面 https://developer.chrome.com/extensions/api_index 上使用 Evernote Clipper 时的结果 extract article in a page

我查看了evernote field 出来的主要文章,在几个页面中,文章实际上是从第一篇文章标签中提取的。然而,evernote clipper 仍然适用于不使用那种标签的页面。

我想知道 Evernote clipper 如何做到这一点?是否有任何js库支持检测包含页面主要内容的主要标签。你能给我一些建议吗?

提前致谢!

最佳答案

据我所知,没有通用的 js 库可以做到这一点。 Evernote clipper 使用自己的方法从网页中提取“有趣”的内容。你可以访问 Evernote clipper 的代码来尝试理解这个过程。

在我的 mac 上,chrome 扩展的路径是:

~/Library/Application Support/Google/Chrome/Default/Extensions/pioclpoplcdbaefihamjohnefbikjilc/6.2_0/

这是另一个功能几乎相同的工具: https://www.readability.com/

您还可以查看此线程:What algorithm does Readability use for extracting text from URLs?

或在谷歌上搜索诸如“内容提取 js 库”之类的术语。(找到这个:https://github.com/hatena/extract-content-javascript)

希望对你有帮助

关于javascript - 如何像 Evernote clipper 那样检测文章的主要标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24857788/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com