- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在使用 DOMDocument和 DOMXPath确定我的 HTML 内容中是否存在某些短语(关键字短语),例如搜索关键字是否为粗体。我使用以下代码并且工作正常,除了在搜索关键字时我需要“忽略”一些字符。使用以下代码:
$characters_to_ignore = array(':','(',')','/');
$keyword = 'keyword AAA';
$content = "Some HTML content for example <b>keyword: AAA</b> and other HTML";
$exp = '//b[contains(., "' . $keyword . '")]|//strong[contains(., "' . $keyword . '")]|//span[contains(@style, "bold") and contains(., "' . $keyword . '")]';
$doc = new DOMDocument();
$doc->loadHTML(strtolower($content));
$xpath = new DOMXPath($doc);
$elements = $xpath->query($exp);
我需要识别“关键字:AAA”和“关键字 AAA”,因此我需要指定 DOMXPath 查询以在搜索关键字短语时忽略变量 $characters_to_ignore 中的字符。
前面的代码对于“关键字 AAA”工作正常,我如何更改它以匹配“关键字:AAA”? (以及 $characters_to_ignore 中的任何字符)
新信息:也许使用 this ?
fn:contains(string1,string2)
但我找不到一个有效的例子。
最佳答案
好吧,您可能已经以某种方式解决了它,但这是解决方案...
使用 XPath 2.0 方法 matches()
会很简单,但是 PHP DOMXPath
类目前仅支持 XPath 1.0。
但是从 PHP 5.3 开始,DOMXPath
类有 registerPHPFunctions()允许我们将 PHP 函数用作 XPath 函数的方法。 :)
让它发挥作用:
$keyword = 'AAA';
$regex = "|keyword[:()/]? $keyword|";
$content = "Some HTML content for example <b>keyword: AAA</b> and other HTML";
$exp = "//b[php:functionString('preg_match', '$regex', .)]|//strong[php:functionString('preg_match', '$regex', .)]|//span[contains(@style, 'bold') and php:functionString('preg_match', '$regex', .)]";
$doc = new DOMDocument();
$doc->loadHTML($content);
$xpath = new DOMXPath($doc);
$xpath->registerNamespace('php', 'http://php.net/xpath');
$xpath->registerPHPFunctions();
$elements = $xpath->query($exp);
关于php - 使用 DOMDocument 和 DOMXPath 如何忽略匹配的某些字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13464392/
如何在不再次查询整个文档的情况下查询子元素的 xpath 结果? 我查询我的文档以找到最后一个 同类menu-item : $doc = new DomDocument(); @$doc->loadH
正在尝试确定哪个更适合我的用例... 对比了这些方法的文档,我模糊的理解是evaluate返回类型化结果但 query没有。此外,query示例包括遍历许多结果,但 evaluate示例假定单一类型的
我面临一个我无法解决的问题。我正在使用 DOMXPath检索 MsgId 的值以下 XML 文件的标记: Test/20171013/CCT10
我这里有一些例子: Mortal Combat: A very good gamenbsp; Call of Duty: Don't buy this game. Street Fighte
到目前为止,我的代码正在使用 xPath 查询获取所有类“forumRow”。如何获得在每个“forumRow”类中存在一次的 a 元素的 href 属性? 我有点卡在我可以从第一个查询的结果开始运行
XML 文件: Root element 4 1 5 3 6
我有这段代码并使用 DOMXPath 删除给定的 td $html = file_get_contents('WebProxy.html'); $xml = new DOMDocument(); $x
我正在使用 DOMDocument/DOMXPath 尝试使 CSS 内联。它会完美地工作,除非我传递给它的 HTML 使它出错,说它不是有效的 XML。 如何设置这些函数来忽略未知标签? 无论如何,
我昨天问了这个问题,当时这正是我所需要的,但是在处理一些实时数据时我发现它并没有完全按照我的预期进行。 Parse HTML with PHP's HTML DOMDocument 它从 HTML 页
假设我有这个: CCC sometexthere AAA sometext DDD something 现在,我想获取 baz 值,它紧跟在
当我想用 XPath 打印计算表达式的结果时出现错误。 $url = $xpath->evaluate('//a/@href', $event);回显 $url ; 我有这个错误:可捕获的 fatal
我有这个 HTML 代码: Hello World 我这样做:$res = $xpath->query(//div[@class='lvlone']/div[@
我有以下html表格结构
我有以下结构: ... ... 问题:基于“输入”标签的“名称”属性选择该tr的表达式是什么?更具体地说,我想知道是否有一种方法,而不必选择输入,然后执行-> parentNode->
当前结构看起来像 //more html //more html //more html //more html
我一直在尝试编写一个 PHP 脚本来使用 DOMXPath 解析 XML 文档。 ;然而我似乎遗漏了一些东西,因为我的 XPath 查询都没有返回任何内容。因此,我尝试淡化我的脚本来尝试解析一个非常基
鉴于此示例文档片段: 300
我使用 DOMXPATH 从 p 标记中删除所有 属性,并且工作正常, // Loop all p. foreach( $dom->getElementsByTagName( "p" ) as $p
我有一段 HTML 代码: Submit 如何在 PHP 中使用 DOMXPath 提取隐藏输入的值?我试过这样的事情: //$site - the html code $doc = n
伙计们,我正在解析 URL 以获取 HTML dom 元素。 这是我的代码: loadHTMLFile($url); $xp = new DOMXPath($dom); $qry = '//scrip
我是一名优秀的程序员,十分优秀!