gpt4 book ai didi

php - 在 PHP 中替换通配符

转载 作者:行者123 更新时间:2023-12-04 22:35:28 25 4
gpt4 key购买 nike

我没有在 PHP 中使用正则表达式的经验,所以我通常会使用一系列 str_replace()、substr()、strpos()、strstr() 等(你懂的)来编写一些复杂的函数。

这一次我想正确地做到这一点,我知道我需要为此使用正则表达式,但对于使用什么(ereg 或 preg)以及语法应该如何准确感到困惑。

注意:我不解析 HTML 或 XML,有时我会使用除(例如 | 或 ~ 或 [tag] 或::)以外的定界符。我正在寻找一种使用正则表达式在两个已知定界符之间进行通配符替换的通用方法,我没有构建 HTML 或 XML 解析器。

我需要的是一个替换它的正则表达式:

<sometag>everything in here</sometag>

用这个:

<sometag>new contents</sometag>

我已经在线阅读了一些文档,但我很困惑,希望你们中的正则表达式专家能提出一个简单的解决方案。我怀疑我会将值传递给函数,如下所示:

$new_text = swapText ( "<sometag>", $the_new_text_to_go_into_the_dag );

function swapText ( $in_tag_with_brackets_to_update, $in_new_text ) {
// define tags
$starting_tag = $in_tag_with_brackets_to_update;
$ending_tag = str_replace( "<", "</", $in_tag_with_brackets_to_update) );

// not sure if this is the proper regex match string or not
// and/or if any escaping needs to be done on the tags
$find_string = "{$starting_tag}.*{$ending_tag}";
$replace_with_string = "{$starting_tag}{$in_new_text}{$ending_tag}";

// after some regex, this function should return new version of <tag>data</tag>
}

谢谢。

最佳答案

你说你不打算解析 xml 然后继续显示一个 xml 示例。这有点令人困惑。

现在,您不能使用正则表达式来解析 xml 的原因是它们不是上下文相关的。因此,有一整类问题不能使用正则表达式。这包括嵌套标签(无论它们是否为 xml),因此请牢记这一点。

顺便提一下,您应该使用 preg - 而不是 eregereg 是一种较少使用、较慢且现已弃用的正则表达式类型。忘掉它吧。

在 pcre(Perl 兼容正则表达式)中,这是 preg 使用的语言,.(点)是一个通配符,它​​匹配任何单个字符(换行符除外)。您可以在匹配后放置量词。量词可以是明确的数字范围,例如 {1,3}(表示至少一个,但最多 3 个),或者您可以使用其中一个简写符号,例如 +({1,} 的缩写,表示至少一个)或 *(表示任何数字,包括零)。有了这些知识,您就可以用 .*.

匹配任何内容

默认情况下,表达式将匹配最大的可能模式(称为贪婪模式)。您可以使用 ? 修饰符更改它。因此 .*? 将匹配任何内容,但会采用尽可能短的模式。然后可以使用它来匹配任何定界值,如下所示:

~<foo>.*?</foo>~

请注意,我在这里使用 ~ 作为分隔符,以避免必须在表达式中转义 /。标准是使用 / 作为分隔符,在这种情况下,表达式将如下所示:

/<foo>.*?<\/foo>/

总的来说,以上是不好的做法,因为匹配否定的字符类比匹配点要好得多,但是为了让事情对您来说简单一点,请忽略它,直到您掌握了基本知识。它在大多数情况下都有效。特别是,由于 . 不匹配换行符,如果内容包含换行符,这将不起作用。如果你需要这个,你可以做两件事之一:要么你添加一个 modifier到表达式,或者,您将 . 替换为包含换行符的字符类。例如 [\s\S](表示空白字符 非空白字符,与任何字符都相同)。这就是表达式的样子:

~<foo>.*?</foo>~s

或者:

~<foo>[\s\S]*?</foo>~

为了让所有这些都起作用,让我们将它传递给 preg_replace 函数:

echo preg_replace('~<foo>.*?</foo>~s', '<foo>Lorem Ipsum</foo>', $input);

如果您的标记名称是可变的,您可以像使用 SQL 查询一样构建表达式。就像 SQL 一样,您需要对某些字符进行转义。为此使用 preg_quote:

function swapText($tagname, $replacement_text, $input) {
$tagname_escaped = preg_quote($tagname, '~');
return preg_replace(
'~<' . $tagname_escaped . '>.*?</' . $tagname_escaped . '>~s',
'<' . $tagname . '>' . $replacement_text . '</' . $tagname . '>',
$input);
}

关于php - 在 PHP 中替换通配符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1816051/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com