gpt4 book ai didi

php - 通过 PHP 提要提取网站的完整内容

转载 作者:行者123 更新时间:2023-12-04 03:17:19 24 4
gpt4 key购买 nike

我想通过提要获取新闻或网站帖子的完整内容。但我们知道,许多网站仅通过其 Feed 展示部分新闻或帖子。
我当然知道存在一个名为 SimplePie 的脚本这是为通过提要获取网站内容而开发的。但此脚本不会检索新闻的全部内容。
我当然找到了一个名为 Full-Text Feeds 的脚本做它。但它不是免费的。我想要一个免费的脚本。
您是否知道类似的脚本或方法来满足我的需求?

最佳答案

五个过滤器的内容提取背后的代码实际上是open source ,并且基于 Readability 的原始 Javascript(在它们成为服务之前)。

你应该可以像这样使用它:

$page = file_get_contents($item_url);
$readability = new Readability($page);
if ($result = $readability->init()) {
$content = $readability->getContent()->innerHTML;
}

关于php - 通过 PHP 提要提取网站的完整内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9163038/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com