gpt4 book ai didi

php - 从页面抓取时如何按顺序获取数据

转载 作者:搜寻专家 更新时间:2023-10-31 21:34:39 24 4
gpt4 key购买 nike

我正在尝试抓取其中一个 URL (http://sportzcosmos.com/2014/03/29/european-football-leagues-weekend-predictions/)。因为我能够将数据单独放入数组中,例如段落、标题。

但我希望它们按网站中的顺序排列,我使用的是 simple_php_dom。

我的代码如下:

foreach($article->find('article.post div.entry-content p') as $p){
$articlecontent[] = $article->plaintext;
}

同样,我也可以获得 header :

 foreach($article->find('article.post div.entry-content h2') as $h){
$articlecontent[] = $article->plaintext;
}

但我想让它们按网站上的顺序排列;有什么办法可以让这些数据井井有条吗?

最佳答案

一种方法是在同一个循环中同时找到两者...

这是一个工作代码:

$url = "http://sportzcosmos.com/2014/03/29/european-football-leagues-weekend-predictions/";

//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a url
$html->load_file($url);

$articlecontent = array();

foreach( $html->find('article.post div.entry-content p, article.post div.entry-content h2') as $article ){
$articlecontent[] = $article->plaintext;
}

print_r($articlecontent);

输出

enter image description here

关于php - 从页面抓取时如何按顺序获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22877355/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com