gpt4 book ai didi

html - 在 PHP 上需要一个好的 HTML 解析器

转载 作者:搜寻专家 更新时间:2023-10-31 23:14:44 25 4
gpt4 key购买 nike

找到这个 http://simplehtmldom.sourceforge.net/但是没有成功

extracting this page http://php.net/manual/en/function.curl-setopt.php
and parse it to plain html, it failed and returned a partial html page

这就是我想做的,转到 html 页面并获取单独的组件(层次结构中所有 div 和 p 的内容)我喜欢 simplehtmldom 的特性,需要任何这样的解析器,它适用于所有代码(最好和最差)。

最佳答案

我经常使用DOMDocument::loadHTML ,在一般情况下效果还不错——我喜欢查询文档,一旦它们作为 DOM 加载,使用 Xpath .

不幸的是,我想,在某些情况下,如果 HTML 页面的格式真的很糟糕,可能会出现一些解析问题... 那时您开始理解遵守网络标准是个好主意。 ..

关于html - 在 PHP 上需要一个好的 HTML 解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1873475/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com