gpt4 book ai didi

java - 在 Java 中使用正则表达式格式化字符串

转载 作者:搜寻专家 更新时间:2023-10-30 19:48:01 28 4
gpt4 key购买 nike

有什么方法可以使用正则表达式将字符串格式化为特定模式,或者 stringbuilder + substring 是一种更快的方法吗?

例如,说一个电话号码 --> 1234567890 作为输入

然后输出为 --> (123) 456-7890

我在这篇文章 https://web.archive.org/web/20211020111604/https://www.4guysfromrolla.com/webtech/031302-1.shtml 上看到这是可能的,但给定的解释是在 ASP 中。我如何在 Java 中做到这一点???

最佳答案

免责声明

由于几个答案已经解决了字符串构建器等更高效率的问题,我想向您展示如何使用正则表达式来完成它,并说明使用这种方法的好处。

一个正则表达式解决方案

使用这个匹配的正则表达式(类似于 Alan Moore's expression ):

(.{3})(.{3})(.{4})

允许您将 10 个字符精确匹配到 3 个组中,然后使用引用这些组的替换表达式,并添加额外的字符:

($1) $2-$3

从而按照您的要求生成替换品。当然,它也会匹配标点符号和字母,这是使用 \d(编码为 Java 字符串为 \\d)而不是 . 通配符.

为什么使用正则表达式?

正则表达式方法的潜在优势是将“逻辑”压缩为字符串操作。由于所有“逻辑”都可以压缩成字符串,而不是预编译代码,因此可以将正则表达式匹配和替换字符串存储在数据库中,以便系统的有经验的用户更容易地进行操作、更新或定制。这使得情况在多个层面上变得更加复杂,但为用户提供了更大的灵 active 。

使用其他方法(字符串操作),更改格式化算法以生成 (555)123-4567555.123.4567 而不是您指定的 (555) 123-4567 基本上不可能仅仅通过用户界面。使用正则表达式方法,修改就像将 ($1) $2-$3 (在数据库或类似存储中)更改为 $1.$2.$3($1)$2-$3 视情况而定。

如果你想修改你的系统以接受“更脏”的输入,这可能包括各种格式化尝试,例如 555-123.4567 并将它们重新格式化为一致的东西,可以使一个字符串操作算法,它能够做到这一点并重新编译应用程序以按照您希望的方式工作。然而,使用正则表达式解决方案,系统大修是不必要的 - 只需像这样更改解析和替换表达式(对于初学者来说可能有点复杂,无法立即理解):

^\D*1?\D*([2-9])\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d).*$
($1$2$3) $4$5$6-$7$8$9$10

这将显着“升级”程序的能力,如下面的重新格式化所示:

"Input"                       "Output"
----------------------------- --------------------------------
"1323-456-7890 540" "(323) 456-7890"
"8648217634" "(864) 821-7634"
"453453453322" "(453) 453-4533"
"@404-327-4532" "(404) 327-4532"
"172830923423456" "(728) 309-2342"
"jh345gjk26k65g3245" "(345) 266-5324"
"jh3g24235h2g3j5h3" "(324) 235-2353"
"12345678925x14" "(234) 567-8925"
"+1 (322)485-9321" "(322) 485-9321"
"804.555.1234" "(804) 555-1234"
"08648217634" <no match or reformatting>

如您所见,它对输入“格式化”非常“宽容”,知道数字开头的 1 应该被忽略,而 0 应该导致错误,因为它无效 - 所有内容都存储在一个字符串中。

问题归结为性能与定制潜力。字符串操作比正则表达式更快,但 future 的增强定制需要重新编译而不是简单地更改字符串。也就是说,有些东西不能很好地表达(或者甚至不能像上面的更改那样以可读的方式表达),有些东西不能用正则表达式表达。

长话短说:

Regex 允许将解析算法存储到一个相对较短的字符串中,该字符串可以很容易地存储以便在不重新编译的情况下进行修改。更简单、更集中的字符串操作函数效率更高,有时可以完成比正则表达式更多的工作。关键是要了解工具和应用程序的要求,并使用最适合情况的工具。

关于java - 在 Java 中使用正则表达式格式化字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8196771/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com