gpt4 book ai didi

PHP - 如何在 Firefox 中获取主要的 HTML 内容,如阅读器模式

转载 作者:行者123 更新时间:2023-12-05 09:23:59 25 4
gpt4 key购买 nike

在 android Firefox 应用程序和 safari iPad 中,我们只能通过“阅读器模式”阅读主要内容。 read more...如何用 PHP 只识别 HTML 中的主要内容?

我需要通过 php 检测主要新闻,如 Firefox 或 safari

例如,我通过以下代码从 bbcsite.com/news/123 获取新闻:

<?php
$html = file_get_contents('http://bbcsite.com/news/123');
?>

然后只显示没有广告的主要新闻,并且...就像 Firefox 和 safari。

我找到了 fivefilters.org .本站可以获取内容!!!

谢谢

最佳答案

名为 PHP Goose 的新 PHP 库似乎在这方面也做得很好。它非常易于使用并且是 Composer友好。

这是实际自述文件中给出的用法示例:

use Goose\Client as GooseClient;

$goose = new GooseClient();
$article = $goose->extractContent('http://url.to/article');

$title = $article->getTitle();
$metaDescription = $article->getMetaDescription();
$metaKeywords = $article->getMetaKeywords();
$canonicalLink = $article->getCanonicalLink();
$domain = $article->getDomain();
$tags = $article->getTags();
$links = $article->getLinks();
$movies = $article->getMovies();
$articleText = $article->getCleanedArticleText();
$entities = $article->getPopularWords();
$image = $article->getTopImage();
$allImages = $article->getAllImages();

关于PHP - 如何在 Firefox 中获取主要的 HTML 内容,如阅读器模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17733275/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com