gpt4 book ai didi

javascript - 长度不一致的子串

转载 作者:行者123 更新时间:2023-11-30 14:16:28 26 4
gpt4 key购买 nike

我有一个很长的字符串,其中包含多个信息。所以我想我们可以说它是几个没有任何分隔符的字段连接在一起的。我知道要使这项工作有效,所有字段的长度都应始终固定。但是,其中两个字段代表一个名称和一个金额,并且没有实现前缀/后缀来保持固定长度。

我想知道如何解决这个问题?下面是字符串示例以及它们应该如何分隔:


示例 #1

Actual Input:
48001MCAbastillas2200800046300017100518110555130000123

How it should be separated:
480 | 01 | MCAbastillas | 2200800046300017 | 100518 | 110555 | 130000 | 123


示例 #2

Actual Input:
48004MCAbastillas22008000463000171005181105555000000123

How it should be separated:
480 | 04 | MCAbastillas | 2200800046300017 | 100518 | 110555 | 5000000 | 123

在我的示例中,只有数量发生了变化,但我预计名称的长度也会发生变化。任何建议将不胜感激。

最佳答案

我可能会为此使用正则表达式。

String test = "48004MCAbastillas22008000463000171005181105555000000123";
Pattern pattern = Pattern.compile("^(\\d{3})(\\d{2})([A-Za-z]+)(\\d{16})(\\d{6})(\\d{6})(\\d+)(\\d{3})$");
Matcher matcher = pattern.matcher(test);
if (matcher.matches())
{
for (int i = 1; i <= matcher.groupCount(); ++i)
{
System.out.print(matcher.group(i) + " | ");
}
}

示例输出:

480 | 04 | MCAbastillas | 2200800046300017 | 100518 | 110555 | 5000000 | 123 |

请注意,第三组和倒数第二组没有固定长度。

如果名字可以包含数字就更难了。我的方法是针对您拥有的数据运行它并打印不匹配的任何内容的列表(即添加 else 子句)。也许那时您可以想出更好的策略来处理这些情况。例如,像 ([A-Za-z]+\w*[A-Za-z]+) 之类的东西可能是一种改进,因为它至少会允许中间的数字姓名。

有时您只需要接受这样的事实,即当您获得的数据很糟糕时,您只需要尽力而为,这可能意味着要丢弃其中的一些数据。

关于javascript - 长度不一致的子串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53498726/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com