gpt4 book ai didi

c# - 如何为必须相等且可以选择用空格分隔的任意数字字符串创建正则表达式

转载 作者:太空狗 更新时间:2023-10-30 01:31:23 25 4
gpt4 key购买 nike

我花了大约 3 个小时尝试创建一个正则表达式来验证自制的坐标字符串(但基于 MGRS)。我在使用正则表达式时总是遇到困难,而这个正则表达式开始让我把头撞在 table 上。

我通常不会要求这么具体的东西,但我知道正则表达式的 friend 都无法提供帮助,而且我自己的研究/尝试学习在这一点上花费的时间太长了。

我将如何创建一个正则表达式来验证以下内容(或者甚至可以这样做)?

AZ AA 0123456789 0123456789 HG-20

  • 所有空格都是可选的
  • 第一组和第二组 2 个字符不区分大小写,但必须是 a-z,并且每个部分都是 2 个字符(第一个是网格区域标识符,第二个是子部分标识符)。
  • 东向和北向数字部分可以是任意长度,只要 2 个“部分”之间的数字总数是偶数即可(例如,“1 1”有效,“04563213245 54986187995”有效,“5598 549” “是无效的)。这是我真正不知所措的部分。
  • “H”是必需的,但不区分大小写(它是坐标字符串“高度”部分的分隔符)
  • 'G'是可选的(它表示转换为Unity坐标时是否使用地面高度)
  • 最后一位是 float ,可以是负数。如果有句点,则后面必须有一个数字。
  • 整个高度部分是可选的。如果出现“H”,则后面必须至少有一个数字(基本上与最后 2 个要点相同的规则)。

我正在为正则表达式引擎使用 C# 和 System.Text.RegularExpressions。

真正让我印象深刻的部分是主要的数字部分。我不确定这是否可行(特别是考虑到东向和北向可以用空格分隔)。

到目前为止,我已经能够想出:

/^[a-z]{2}\s?[a-z]{2}\s?\d+\s?\d+\s?hg?[-+]?\d+.?\d+?/ig

但它实际上并没有验证没有空格的坐标的长度是否为偶数,也无法判断整个高度部分是否是可选的(从技术上讲,它使 H 成为必需的......没有线索如何分段...)。

最终,由于我在代码中将字符串分开,我可以用实际代码验证它(如果数字子字符串甚至没有抛出 InvalidArgument 或 ArgumentOutOfRange 异常,因为此逻辑发生在 Location 类的构造函数中)。不过,如果验证可以在正则表达式中完成,这似乎是一个糟糕的 juju。

例子:

  • AZ AA 012345 012345 HG-20(有效)
  • AZAA 012345 012345 HG-20(有效)
  • AZAA012345012345HG-20(有效)
  • AZ AA 012345 012345(有效)
  • AZ AA 012345 01234(无效,东进和北进是不同的长度)
  • AZ AA 012345 012345 HG(无效,如果“H”存在则必须有数字)
  • AZ AA 012345 012345 H(无效,如果“H”存在则必须有数字)

谢谢!

如果有人对我的代码目前的样子感到好奇:

public Location(string coordinateString)
{
//TODO: Validate string

//Calling ToUpper() as we never want to worry about casing. Everything is upper case.
var stripped = coordinateString.ToUpper().Replace(" ", "");
var gridZonedesignator = stripped.Substring(0, 2);
var subLocationId = stripped.Substring(2, 2);
var identifiersRemoved = stripped.Remove(0, 4);
var heightParsed = identifiersRemoved.Split('H');

float height = 0;
bool useGroundHeight = false;

//If the height component is there, parse ground height flag (if there) and set
//height.
if (heightParsed.Length > 1)
{
if (heightParsed[1].StartsWith("G"))
{
useGroundHeight = true;
heightParsed[1] = heightParsed[1].Remove(0);
}

height = float.Parse(heightParsed[1], CultureInfo.InvariantCulture);
}

//Since the total digits of the easting/northing section must be equal,
//simply divide by 2 to separate the number of digits the easting and
//northing each consist of (accuracy).
var accuracy = heightParsed[0].Length / 2;

// It's possible to end up with accuracy 1, 2, or 3, in which case we want
//to pad 0s to the right as a 1 digit coordinate translates to thousands,
//not ones as a grid zone is currently 10k x 10k meters.
//TODO: Base the digits off the scale of a grid zone instead of hard
//coding to 4. If we change the scale the following will no longer be
//valid.
var eastingString = heightParsed[0].Substring(0, accuracy).PadRight(4,'0');
var northingString = heightParsed[0].Substring(accuracy, accuracy).PadRight(4,'0');

CoordinateString = coordinateString;
GridZoneDesignation = gridZonedesignator;
SubLocationId = subLocationId;
Easting = eastingString;
EastingInt = int.Parse(Easting);
Northing = northingString;
NorthingInt = int.Parse(Northing);
IsStartFromGroundHeight = useGroundHeight;
Height = height;
}

最佳答案

让我们试着把它放在一起。

  • 匹配 AZ AA 的第一部分,AZAA 非常简单明了。
    ^(?:[A-Z] {2} ?){2}^ anchor匹配开始,(: 打开一个 non capturing group .

  • 您尝试 \d+\s?\d+ 的第二部分是挑战。它对我来说就像你想要匹配两组具有相同长度并且在中间由一个可选空格分隔的数字。像 (?:\d ?\d ?)+ 这样的东西对你的输入来说不方便,因为它也会匹配 0 123 01 23 但只允许这样作为 0123 0123
    您可以使用.NET Regex 的一项特殊功能,称为balancing groups。 .深入研究一下。基本上将东西添加到堆栈中,然后在另一组中再次减去它,直到卡住的东西消失。试试 (?'x'\d)+ ?(?'-x'\d)+(?(x)(?!))在 regexstorm。

  • 终于到了最后一个可选部分。 H 后跟一个可选的 G,一个可选的 -+ 和一个不以数字结尾的可选 float ,如果句点出现:(?:HG?[+-]\d​​+(?:\.\d+)?)?

用可选空间组装总模式可以是

^(?:[A-Z]{2} ?){2}(?'x'\d)+ ?(?'-x'\d)+(?(x)(?!)) ?(?:HG?[+-]\d+(?:\.\d+)?)?$

See demo at regexplanet (单击绿色 .NET 按钮)或 regexstorm .

关于c# - 如何为必须相等且可以选择用空格分隔的任意数字字符串创建正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41412368/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com