gpt4 book ai didi

c++ - 需要帮助构建正则表达式模式

转载 作者:行者123 更新时间:2023-11-30 01:12:39 25 4
gpt4 key购买 nike

我未能为 STL regex_match 函数创建模式,需要一些帮助来理解为什么我创建的模式不起作用以及如何修复它。我认为正则表达式会对 dl.boxcloud.com 产生影响,但事实并非如此。

****仍在寻找意见。我更新了程序反射(reflect)建议。当我认为应该是一场比赛时,却有两场比赛。

#include <string>
#include <regex>
using namespace std;

wstring GetBody();
int _tmain(int argc, _TCHAR* argv[])
{
wsmatch m;
wstring regex(L"(dl\\.boxcloud\\.com|api-content\\.dropbox\\.com)");
regex_search(GetBody(), m, wregex(regex));
printf("%d matches.\n", m.size());

return 0;
}
wstring GetBody() {
wstring body(L"ABOUTLinkedIn\r\n\r\nwall of textdl.boxcloud.com/this/file/bitbyte.zip sent you a message.\r\n\r\nDate: 12/04/2012\r\n\r\nSubject: RE: Reference Ask\r\n\r\nOn 12/03/12 2:02 PM, wall of text wrote:\r\n--------------------\r\nRuba,\r\n\r\nI am looking for a n.");
return body;
}

最佳答案

代码本身没有问题。您将 m.size() 误认为是匹配项的数量,而实际上,它是您的正则表达式返回的的数量。

std::match_results::size reference不利于理解:

Returns the number of matches and sub-matches in the match_results object.

总共有 2 个组(因为您围绕 2 个备选方案定义了一个捕获组)和 1 个匹配项。

参见 this IDEONE demo

#include <regex>
#include <string>
#include <iostream>
#include <time.h>
using namespace std;

int main()
{
string data("ABOUTLinkedIn\r\n\r\nwall of textdl.boxcloud.com/this/file/bitbyte.zip sent you a message.\r\n\r\nDate: 12/04/2012\r\n\r\nSubject: RE: Reference Ask\r\n\r\nOn 12/03/12 2:02 PM, wall of text wrote:\r\n--------------------\r\nRuba,\r\n\r\nI am looking for a n.");
std::regex pattern("(dl\\.boxcloud\\.com|api-content\\.dropbox\\.com)");
std::smatch result;

while (regex_search(data, result, pattern)) {
std::cout << "Match: " << result[0] << std::endl;
std::cout << "Captured text 1: " << result[1] << std::endl;
std::cout << "Size: " << result.size() << std::endl;
data = result.suffix().str();
}
}

输出:

Match: dl.boxcloud.com
Captured text 1: dl.boxcloud.com
Size: 2

看,捕获的文本等于整个匹配项。

要“修复”这个问题,您可以使用非捕获组,或者完全删除分组:

std::regex pattern("(?:dl\\.boxcloud\\.com|api-content\\.dropbox\\.com)");
// or
std::regex pattern("dl\\.boxcloud\\.com|api-content\\.dropbox\\.com");

此外,在声明正则表达式时考虑使用原始字符串文字(以避免反斜杠 hell ):

std::regex pattern(R"(dl\.boxcloud\.com|api-content\.dropbox\.com)");

关于c++ - 需要帮助构建正则表达式模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33744499/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com