- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章php使用自带dom扩展进行元素匹配的原理解析由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
DOMDocument 。
php提供了非常好用的解析html和xml文档的扩展库DOM,使用这个库可以非常高效的进行html和xml文档的解析,它的原理就是通过寻找首尾匹配对来进行文档的解析.
从上面的分析可以看出,如果首位不匹配,可能就会导致一些错误的出现,因此,这个时候我们需要设置 。
1
|
libxml_use_internal_errors(true);
|
来进行错误的屏蔽,让它可以解析整个文档.
解析html基本用法 。
1
2
3
4
5
|
$dom
=
new
\DOMDocument;
$content
= htmlspecialchars_decode(
$content
);
libxml_use_internal_errors(true);
$content
= mb_convert_encoding(
$content
,
'HTML-ENTITIES'
,
'UTF-8'
);
$dom
->loadHTML(
$content
);
|
$content是要解析的html字符串,其中我们对它进行了转义,因为可能含有实体集,然后我们有进行了编码的转换,因为可能文档不是utf-8格式的,会导致日文,法文等文字乱码.
获取元素 。
1
2
|
$a
=
$dom
->getElementsByTagName(
'a'
);
$p
=
$dom
->getElementsByTagName(
'p'
);
|
遍历元素 。
1
2
3
4
|
$elements
=
$dom
->getElementsByTagName(
'a'
);
foreach
(
$elements
as
$element
) {
$element
->textContent =
'替换成其它的文字'
;
}
|
通过上面的循环,可以将全部a标签的文字替换掉.
元素嵌套 。
有些时候,html会嵌套很多层,比如 。
1
2
3
4
5
6
7
8
|
<
div
>
<
p
>
<
a
href
=
"xxx"
rel
=
"external nofollow"
>我是文字</
a
>
</
p
>
<
p
>
内容替换
</
p
>
</
div
>
|
如果我们想要对p标签文字进行替换的化,并且不想要替换含有子元素的内容,就是这里的a标签不想替换,下面的语句不能够解决我们的问题:
1
2
3
4
5
6
|
$elements
=
$dom
->getElementsByTagName(
'p'
);
foreach
(
$elements
as
$element
) {
if
(
$element
->hasChildNodes()){
$element
->textContent =
'p标签内容替换'
;
}
}
|
上面的代会将a标签的内容也替换掉,这不是我们想要的结果,因为hasChildNodes()这个函数表示的含有内容,无论它是标签还是文字,它都是返回true的,除非它是空标签,例如 。
它才会返回false. 。
所以我们需要自己封装一个函数进行检查是否含有嵌套标签.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
function
hasChild(
$element
,
$tags
)
{
foreach
(
$tags
as
$v
){
$elements
=
$element
->getElementsByTagName(
$v
);
if
(
$elements
->length){
return
true;
}
}
return
false;
}
$tags
=
array
(
'title'
,
'h1'
,
'h2'
,
'h3'
,
'h4'
,
'h5'
,
'a'
,
'p'
,
'dd'
,
'img'
);
$elements
=
$dom
->getElementsByTagName(
'p'
);
foreach
(
$elements
as
$element
) {
if
(hasChild(
$element
,
$tags
)){
$element
->textContent =
'p标签内容替换'
;
}
}
|
通过我们自己封装的函数,就可以判断出$dom的node节点是否含有子标签.
总结 。
到此这篇关于php使用自带dom扩展进行元素匹配的文章就介绍到这了,更多相关php元素匹配内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。
原文链接:https://www.80shihua.com/archives/2491 。
最后此篇关于php使用自带dom扩展进行元素匹配的原理解析的文章就讲到这里了,如果你想了解更多关于php使用自带dom扩展进行元素匹配的原理解析的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我一直在使用 AJAX 从我正在创建的网络服务中解析 JSON 数组时遇到问题。我的前端是一个简单的 ajax 和 jquery 组合,用于显示从我正在创建的网络服务返回的结果。 尽管知道我的数据库查
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我在尝试运行 Android 应用程序时遇到问题并收到以下错误 java.lang.NoClassDefFoundError: com.parse.Parse 当我尝试运行该应用时。 最佳答案 在这
有什么办法可以防止etree在解析HTML内容时解析HTML实体吗? html = etree.HTML('&') html.find('.//body').text 这给了我 '&' 但我想
我有一个有点疯狂的例子,但对于那些 JavaScript 函数作用域专家来说,它看起来是一个很好的练习: (function (global) { // our module number one
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
我需要编写一个脚本来获取链接并解析链接页面的 HTML 以提取标题和其他一些数据,例如可能是简短的描述,就像您链接到 Facebook 上的内容一样。 当用户向站点添加链接时将调用它,因此在客户端启动
在 VS Code 中本地开发时,包解析为 C:/Users//AppData/Local/Microsoft/TypeScript/3.5/node_modules/@types//index而不是
我在将 json 从 php 解析为 javascript 时遇到问题 这是我的示例代码: //function MethodAjax = function (wsFile, param) {
我在将 json 从 php 解析为 javascript 时遇到问题 这是我的示例代码: //function MethodAjax = function (wsFile, param) {
我被赋予了将一种语言“翻译”成另一种语言的工作。对于使用正则表达式的简单逐行方法来说,源代码过于灵活(复杂)。我在哪里可以了解更多关于词法分析和解析器的信息? 最佳答案 如果你想对这个主题产生“情绪化
您好,我在解析此文本时遇到问题 { { { {[system1];1;1;0.612509325}; {[system2];1;
我正在为 adobe after effects 在 extendscript 中编写一些代码,最终变成了 javascript。 我有一个数组,我想只搜索单词“assemble”并返回整个 jc3_
我有这段代码: $(document).ready(function() { // }); 问题:FB_RequireFeatures block 外部的代码先于其内部的代码执行。因此 who
背景: netcore项目中有些服务是在通过中间件来通信的,比如orleans组件。它里面服务和客户端会指定网关和端口,我们只需要开放客户端给外界,服务端关闭端口。相当于去掉host,这样省掉了些
1.首先贴上我试验成功的代码 复制代码 代码如下: protected void onMeasure(int widthMeasureSpec, int heightMeasureSpec)
什么是 XML? XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。 你可以通过本站学习 X
【PHP代码】 复制代码 代码如下: $stmt = mssql_init('P__Global_Test', $conn) or die("initialize sto
在SQL查询分析器执行以下代码就可以了。 复制代码代码如下: declare @t varchar(255),@c varchar(255) declare table_cursor curs
前言 最近练习了一些前端算法题,现在做个总结,以下题目都是个人写法,并不是标准答案,如有错误欢迎指出,有对某道题有新的想法的友友也可以在评论区发表想法,互相学习🤭 题目 题目一: 二维数组中的
我是一名优秀的程序员,十分优秀!