gpt4 book ai didi

c++ - 如何只获得给定的捕获组 C++

转载 作者:搜寻专家 更新时间:2023-10-31 02:11:50 25 4
gpt4 key购买 nike

我想提取标签的内部内容。来自以下字符串:

<tag1 val=123>Hello</tag1>

我只想得到

Hello

我的工作:

string s = "<tag1 val=123>Hello</tag1>";
regex re("<tag1.*>(.*)</tag1>");
smatch matches;
bool b = regex_match(s, matches, re);

但它返回两个匹配项:

<tag1 val=123>Hello</tag1>
Hello

当我尝试像这样只获取第一个捕获组时:

"<tag1.*>(.*)</tag1>\1"

我得到零个匹配项。

请指教。

最佳答案

regex_match 仅返回一个匹配项,包含所有捕获组子匹配项(它们的数量取决于模式中有多少组)。

在这里,您只会得到 1 个包含两个子匹配项的匹配项:1) 整个匹配项,2) 捕获组 1 的值。

要获取捕获组的内容,需要访问smatches对象第二个元素,matches[1].str()matches.str(1)

注意当你写"<tag1.*>(.*)</tag1>\1" , \1未被解析为反向引用,而是作为具有八进制代码 1 的字符。即使您定义了一个反向引用(如 "<tag1.*>(.*)</tag1>\\1"),您也需要使用捕获组 1 在 </tag1> 之后重复- 那绝对不是你想要的。实际上,我怀疑这个正则表达式有什么用,至少,你需要替换 ".*""[\\s\\S]*?" , 但它仍然是一种使用正则表达式解析 HTML 的脆弱方法。

关于c++ - 如何只获得给定的捕获组 <regex> C++,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42983337/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com