gpt4 book ai didi

c# - 字符串上unicode字符的正则表达式

转载 作者:太空狗 更新时间:2023-10-30 01:27:24 27 4
gpt4 key购买 nike

我正在使用 C# 进行一些 OCR 工作,并提取了我需要使用的文本。现在我需要使用正则表达式解析一行。

string checkNum;
string routingNum;
string accountNum;
Regex regEx = new Regex(@"\u9288\d+\u9288");
Match match = regEx.Match(numbers);
if (match.Success)
checkNum = match.Value.Remove(0, 1).Remove(match.Value.Length - 1, 1);
regEx = new Regex(@"\u9286\d{9}\u9286");
match = regEx.Match(numbers);
if(match.Success)
routingNum = match.Value.Remove(0, 1).Remove(match.Value.Length - 1, 1);
regEx = new Regex(@"\d{10}\u9288");
match = regEx.Match(numbers);
if (match.Success)
accountNum = match.Value.Remove(match.Value.Length - 1, 1);

问题是当我执行 .ToCharArray() 并检查字符串的内容时,字符串包含必要的 Unicode 字符,但是当我解析寻找他们的字符串。我认为 C# 中的字符串默认是 Unicode。

最佳答案

我想通了。我使用的是十进制值而不是十六进制代码换句话说,我应该使用 \u2448 和\u2446 http://www.ssec.wisc.edu/~tomw/java/unicode.html#x2440 而不是使用 \u9288 和\u9286

感谢大家带领我朝着正确的方向前进。

关于c# - 字符串上unicode字符的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2835100/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com