gpt4 book ai didi

php - 在 php 中不区分大小写的 xpath 搜索

转载 作者:可可西里 更新时间:2023-11-01 13:15:39 25 4
gpt4 key购买 nike

我有一个这样的 xml 文件:

<volume name="Early">
<book name="School Years">
<chapter number="1">
<line number="1">Here's the first line with Chicago in it.</line>
<line number="2">Here's a line that talks about Atlanta</line>
<line number="3">Here's a line that says chicagogo </line>
</chapter>
</book>
</volume>

我正在尝试使用 PHP 进行简单的关键字搜索,查找单词并显示它所在的行。我有这个工作

$xml = simplexml_load_file($data);
$keyword = $_GET['keyword'];
$kw=$xml->xpath("//line[contains(text(),'$keyword')]");
...snip...

echo $kw[0]." is the first returned item";

但是,使用这种技术,用户必须搜索“Chicago”而不是“chicago”,否则搜索将不会返回任何结果。

我知道我需要使用翻译功能,但我所有的尝试和错误都是徒劳的。

我试过:

$upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
$lower = "abcdefghijklmnopqrstuvwxyz";
$kw = $xml->xpath("line[contains(text(),'translate('$keyword','$upper','$lower'))]");

但似乎没有任何效果。有小费吗?

最佳答案

Gordon 建议在 XPath 中使用 PHP 函数,如果您选择使用它,将会证明它更加灵活。然而,与他的回答相反,translate字符串函数在 XPath 1.0 中可用,这意味着您可以使用它;你的问题是如何

首先,Charles 在对问题的评论中指出了明显的拼写错误。然后是您如何尝试匹配文本值的逻辑。


在单词形式中,您目前在问“文本是否包含关键字的小写形式?”这并不是您真正想问的。相反,问“小写文本是否包含小写关键字?”将其翻译回 XPath 领域(请原谅双关语)将是:

(注意:为了便于阅读截断字母)

//line[contains(translate(text(),'ABC...Z','abc...z'),'chicago')]

上面将 line 中包含的文本小写然后节点检查它(小写文本)是否包含关键字 chicago .


现在是强制性代码片段(但实际上,上面的想法是您真正需要带回家的):

$xml    = simplexml_load_file($data);
$search = strtolower($keyword);
$nodes = $xml->xpath("//line[contains(translate(text(), 'ABCDEFGHJIKLMNOPQRSTUVWXYZ', 'abcdefghjiklmnopqrstuvwxyz'), '$search')]");

echo 'Got ' . count($nodes) . ' matches!' . PHP_EOL;
foreach ($nodes as $node){
echo $node . PHP_EOL;
}

dijon's comment 之后

编辑

在 foreach 中,您可以访问行号、章节号和书名,如下所示。

行号 -- 这只是 <line> 上的一个属性使访问它变得 super 容易的元素。使用 SimpleXML 有两种方法可以访问它:$node['number']$node->attributes()->number (我更喜欢前者)。

第 number - 正如您所说的那样,要做到这一点,我们需要向上遍历树。如果我们使用 DOM 类,我们将有一个方便的 $node->parentNode属性(property)将我们直接带到<chapter> (因为它是我们 <line> 的直接祖先)。 SimpleXML 没有这样一个方便的属性,但我们可以使用相对 XPath 查询来获取它。 parent axis允许我们向上遍历树。

xpath()返回一个数组,我们可以作弊并使用 current()访问从它返回的数组中的第一个(也是唯一一个)项目。那么这只是访问 number 的问题属性如上。

// In the near future we can use: current(...)['number'] but not yet
$chapter = current($node->xpath('./parent::chapter'))->attributes()->number;

书名 -- 此过程与访问章节编号的过程相同。来自 <line> 的相对 XPath 查询可以利用 ancestor axis喜欢./ancestor::book (或 ./parent:chapter/parent::book )。希望你能弄清楚如何访问它的 name属性。

关于php - 在 php 中不区分大小写的 xpath 搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3238989/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com