gpt4 book ai didi

java - 度分秒 (DMS) 正则表达式

转载 作者:行者123 更新时间:2023-12-01 21:24:22 50 4
gpt4 key购买 nike

我有一个正则表达式,我想以各种方式匹配纬度/经度对,例如

123 34 42
-123* 34' 42"
123* 34' 42"
+123* 34' 42"
45* 12' 22"N
45 12' 22"S
90:00:00.0N

我希望能够将它们配对,这样

90:00:00.0N 180:00:00.0E 是纬度/经度对。

45* 12' 22"N 46* 12' 22"E 是纬度/经度对(1 度 x 1 度单元格)。

123* 34' 42"124* 34' 42" 是纬度/经度对

等等

使用下面的正则表达式,当我输入 123 时,它匹配。我认为这是正确的,因为 123 00 00 是一个有效的坐标。但是,我想使用这个正则表达式来匹配上面相同格式的对

   "([-|\\+]?\\d{1,3}[d|D|\u00B0|\\s](\\s*\\d{1,2}['|\u2019|\\s])?"
+ "(\\s*\\d{1,2}[\"|\u201d|\\s])?\\s*([N|n|S|s|E|e|W|w])?\\s?)"

我正在使用 Java。

* 表示程度。

我的正则表达式做错了什么?

最佳答案

嗯,一方面,您用一堆不必要的管道字符填充字符集 - 交替隐含在 [] 对中。额外的清理:+ 不需要在字符类中转义。您的正则表达式似乎正在解决比您给我们的更大的问题陈述 - 您没有提到 dD 作为可匹配字符。并且您已经将正则表达式的整个后半部分变成了可选的。根据我认为您最初的问题陈述,我构建了以下正则表达式:

^\s*([+-]?\d{1,3}\*?\s+\d{1,2}'?\s+\d{1,2}"?[NSEW]?|\d{1,3}(:\d{2}){2}\.\d[NSEW]\s*){1,2}$

这有点奇怪,但我会为您或将来遇到此问题的任何人分解它(你好, future !)。

^

字符串开头,简单。

\s*

任意数量的空白 - 甚至没有。

( 

表示组的开始 - 我们稍后会讨论这一点。

[-+]?

可选标志

\d{1,3}

1 到三位数

\*?

可选的星号 - 此处的转义是星号的关键,但如果您想将其替换为实际程度的 unicode 代码点,则不需要它。

\s+

至少一个空格字符

\d{1,2}

1 或两位数字。

'?

可选撇号

\s+\d{1,2}+

您之前已经见过这些,但有一个新的曲线球 - {1,2} 量词后面有一个加号!这使得它成为一个占有量词,这意味着匹配器不会放弃该组的匹配以使另一组成为可能。这几乎完全是为了防止 1 1 11 1 1 匹配,但可以在您 100% 确定不需要回溯的任何地方用来提高速度。

"?

可选的双引号。您必须在 Java 中转义它。

[NSEW]?

可选的基本方向,由字母指定

|

或者 - 您可以匹配组中在此之前的所有内容,或组中在此之后的所有内容。

\d{1,3}

旧消息。

(:\d{2})

一个冒号,后跟两个字符...

{2}

两次!

\.\d

小数点,后跟一位数字。

[NSEW]

与之前相同,但这次是强制性的。

\s*)

一些空间,终于该组结束了。现在,第一组已匹配整个经度/纬度表示,末尾有任意数量的空格。紧随其后的是:

{1,2}

这样做一次或两次 - 匹配一个或一对,最后:

$

字符串的结尾。

这并不完美,但非常接近,而且我认为它回答了最初的问题陈述。另外,我觉得我的解释已经足够揭开它的神秘面纱,您可以对其进行编辑以进一步满足您的需求。它没有(也不会)做的一件事是强制第一个坐标与第二个坐标的样式相匹配。对正则表达式的要求实在是太高了。

怀疑者:Here it is in action 。请尽情享受。

关于java - 度分秒 (DMS) 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13611668/

50 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com