gpt4 book ai didi

php - 分析 HTML 页面

转载 作者:行者123 更新时间:2023-11-28 04:41:41 25 4
gpt4 key购买 nike

我有一个关于 HTML 页面分析的问题。例如,有一个页面 www.example.com/page.html 包含我需要的表格信息,而 www.example.com/page2.html 有一些其他信息,但采用文本格式。目前,我正在使用一个正则表达式 (preg_match_all),我必须在其中插入一个手工制作的模式。有没有更快/更好的方法来做到这一点。所以完整的问题是:是否有一种快速/好的方法可以从不需要我通过正则表达式使用和编辑部分源代码的 HTML 页面中提取信息?

(其他信息:我使用 PHP i.c.w. cURL 获取页面内容,然后使用 preg_match_all 提取数据)

最佳答案

是的!您可以将网页内容加载到 PHP DOMDocument 中,并使用 html 类和 ID 获取数据,就像使用 Javascript 一样。

这是文档 http://www.php.net/manual/en/class.domdocument.php

你应该从使用开始

DOMDocument::loadHTML($html);

然后按照文档及其示例进行操作

关于php - 分析 HTML 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5735016/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com