gpt4 book ai didi

c++ - QRegExp 仅解析以特定字符开头的字符串

转载 作者:行者123 更新时间:2023-11-28 05:58:27 25 4
gpt4 key购买 nike

我正在尝试使用正则表达式解析这些字符串,但我认为我的正则表达式语句不正确。

我得到一个字符串,每当它有换行符和回车符时,它们必须分成两个字符串。字符串具有以下格式

[CharSize][Inverted][Aligned]Data

例如,如果我得到这样的数据

QString s1 = "[6][1][0]Data1\n\r[5][0][1]Data2";

当我将它们分开时,将有两个 QString,我将获取左括号和右括号内的数据。

另一个有效数据是这样的:

QString s2 = "[7][0][1]Data3"

无效数据是这样的:

QString s3 = "abc[8][1][1]Data4"

我在下面应用了以下 QRegExp:

QRegExp clrf("\n\r|\r\n|\n");
QStringList sp = str.split(clrf);

QRegexp clrf 可以很好地用换行符和回车符、反向或只是换行符来分隔数据。注意:这里s1、s2、s3处理的很好。

问题出在这里:

QRegExp value("[^a-z]?\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");

当我使用上面的代码时,s1、s2和s3都被处理了。 S3 不应 被处理,因为它的第一个字符不是左括号。你能帮我更正我的 QRegExp 吗?

谢谢。

编辑:完整代码:

void parseString(QString str)
{

QRegExp clrf("\n\r|\r\n|\n");
QRegExp value("\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");
// QRegExp value("^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$");

int p = 0, i = 0;
int res;
int cs = 0, inv = 0, al = 0;

QStringList sp = str.split(clrf);

XLineString ls;

for (i = 0; i < sp.size(); ++i) {
res = value.indexIn(sp[i], p);
while (res != -1) {
printf("Text=[%s]\n", value.cap(EData).toStdString().c_str());

printf("Digit cs[%d] ", value.cap(ECharSize).toInt());
printf("inv[%d] ", value.cap(EInvert).toInt());
printf("al[%d]\n", value.cap(EAlignment).toInt());

cs = value.cap(ECharSize).toInt();
if (value.cap(EInvert).toInt())
inv = 1;
else
inv = 0;

if (value.cap(EAlignment).toInt())
al = 1;
else
al = 0;
ls.addLine(value.cap(EData).toStdString().c_str(), cs, inv, al);
p += value.matchedLength();
res = value.indexIn(str, p);
}
}
}

int main()
{
QString str1[] = {
"[12][0][0]DATA1\n\r[78][0][1]DATA2",
"abc[1][1][1]THIS SHOULD NOT PASS",
};

for (int i = 0; i < sizeof(str1) / sizeof(str1[0]); ++i)
parseString(str1[i]);
}

最佳答案

为了回答您的问题,我已经使用 PyQt5 对此进行了测试(为简单起见)

import re
R = ["\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)", "^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$"]
tests = ["[6][1][0]Data1\n\r[5][0][1]Data2", "[7][0][1]Data3", "abc[8][1][1]Data4"]
s = re.compile("\n\r|\r\n|\n") # emulate QRegExp split feature
for r in R:
r=QRegExp(r)
for T in tests:
for t in s.split(T):
print(r.indexIn(t))

结果:

0
0
0
3
0
0
0
-1

结论:如果您简单地测试“indexIn”等于 0 而不是不等于 -1,您的原始匹配也可以工作,而我的修改版本应该可以工作。

我认为最好的办法是简单地修改代码以确保索引等于 0。我可能还建议您使用 If 语句而不是 While 语句,否则您可能会重复匹配同一行。

关于c++ - QRegExp 仅解析以特定字符开头的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33727135/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com