- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
有什么方法可以使用正则表达式将字符串格式化为特定模式,或者 stringbuilder + substring 是一种更快的方法吗?
例如,说一个电话号码 --> 1234567890 作为输入
然后输出为 --> (123) 456-7890
我在这篇文章 https://web.archive.org/web/20211020111604/https://www.4guysfromrolla.com/webtech/031302-1.shtml 上看到这是可能的,但给定的解释是在 ASP 中。我如何在 Java 中做到这一点???
最佳答案
由于几个答案已经解决了字符串构建器等更高效率的问题,我想向您展示如何使用正则表达式来完成它,并说明使用这种方法的好处。
使用这个匹配的正则表达式(类似于 Alan Moore's expression ):
(.{3})(.{3})(.{4})
允许您将 10 个字符精确匹配到 3 个组中,然后使用引用这些组的替换表达式,并添加额外的字符:
($1) $2-$3
从而按照您的要求生成替换品。当然,它也会匹配标点符号和字母,这是使用 \d
(编码为 Java 字符串为 \\d
)而不是 .
通配符.
正则表达式方法的潜在优势是将“逻辑”压缩为字符串操作。由于所有“逻辑”都可以压缩成字符串,而不是预编译代码,因此可以将正则表达式匹配和替换字符串存储在数据库中,以便系统的有经验的用户更容易地进行操作、更新或定制。这使得情况在多个层面上变得更加复杂,但为用户提供了更大的灵 active 。
使用其他方法(字符串操作),更改格式化算法以生成 (555)123-4567
或 555.123.4567
而不是您指定的 (555) 123-4567
基本上不可能仅仅通过用户界面。使用正则表达式方法,修改就像将 ($1) $2-$3
(在数据库或类似存储中)更改为 $1.$2.$3
或 ($1)$2-$3
视情况而定。
如果你想修改你的系统以接受“更脏”的输入,这可能包括各种格式化尝试,例如 555-123.4567
并将它们重新格式化为一致的东西,可以使一个字符串操作算法,它能够做到这一点并重新编译应用程序以按照您希望的方式工作。然而,使用正则表达式解决方案,系统大修是不必要的 - 只需像这样更改解析和替换表达式(对于初学者来说可能有点复杂,无法立即理解):
^\D*1?\D*([2-9])\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d)\D*(\d).*$
($1$2$3) $4$5$6-$7$8$9$10
这将显着“升级”程序的能力,如下面的重新格式化所示:
"Input" "Output"
----------------------------- --------------------------------
"1323-456-7890 540" "(323) 456-7890"
"8648217634" "(864) 821-7634"
"453453453322" "(453) 453-4533"
"@404-327-4532" "(404) 327-4532"
"172830923423456" "(728) 309-2342"
"jh345gjk26k65g3245" "(345) 266-5324"
"jh3g24235h2g3j5h3" "(324) 235-2353"
"12345678925x14" "(234) 567-8925"
"+1 (322)485-9321" "(322) 485-9321"
"804.555.1234" "(804) 555-1234"
"08648217634" <no match or reformatting>
如您所见,它对输入“格式化”非常“宽容”,知道数字开头的 1
应该被忽略,而 0
应该导致错误,因为它无效 - 所有内容都存储在一个字符串中。
问题归结为性能与定制潜力。字符串操作比正则表达式更快,但 future 的增强定制需要重新编译而不是简单地更改字符串。也就是说,有些东西不能很好地表达(或者甚至不能像上面的更改那样以可读的方式表达),有些东西不能用正则表达式表达。
Regex 允许将解析算法存储到一个相对较短的字符串中,该字符串可以很容易地存储以便在不重新编译的情况下进行修改。更简单、更集中的字符串操作函数效率更高,有时可以完成比正则表达式更多的工作。关键是要了解工具和应用程序的要求,并使用最适合情况的工具。
关于java - 在 Java 中使用正则表达式格式化字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8196771/
我正在用 yacc/bison 编写一个简单的计算器。 表达式的语法看起来有点像这样: expr : NUM | expr '+' expr { $$ = $1 + $3; } | expr '-'
我开始学习 lambda 表达式,并在以下情况下遇到了以下语句: interface MyNumber { double getValue(); } MyNumber number; nu
这两个 Linq 查询有什么区别: var result = ResultLists().Where( c=> c.code == "abc").FirstOrDefault(); // vs. va
如果我们查看 draft C++ standard 5.1.2 Lambda 表达式 段 2 说(强调我的 future ): The evaluation of a lambda-expressio
我使用的是 Mule 4.2.2 运行时、studio 7.5.1 和 Oracle JDK 1.8.0_251。 我在 java 代码中使用 Lambda 表达式,该表达式由 java Invoke
我是 XPath 的新手。我有网页的html源 http://london.craigslist.co.uk/com/1233708939.html 现在我想从上面的页面中提取以下数据 完整日期 电子
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我将如何编写一个 Cron 表达式以在每天上午 8 点和下午 3:30 触发?我了解如何创建每天触发一次的表达式,而不是在多个设定时间触发。提前致谢 最佳答案 你应该只使用两行。 0 8 * * *
这个问题已经有答案了: What do 3 dots next to a parameter type mean in Java? (9 个回答) varargs and the '...' argu
我是 python 新手,在阅读 BeautifulSoup 教程时,我不明白这个表达式“[x for x in titles if x.findChildren()][:-1]”我不明白?你能解释一
(?:) 这是一个有效的 ruby 正则表达式,谁能告诉我它是什么意思? 谢谢 最佳答案 正如其他人所说,它被用作正则表达式的非捕获语法,但是,它也是正则表达式之外的有效 ruby 语法。 在
这个问题在这里已经有了答案: Why does ++[[]][+[]]+[+[]] return the string "10"? (10 个答案) 关闭 8 年前。 谁能帮我处理这个 JavaSc
这个问题在这里已经有了答案: What is the "-->" operator in C++? (29 个答案) Java: Prefix/postfix of increment/decrem
这个问题在这里已经有了答案: List comprehension vs. lambda + filter (16 个答案) 关闭 10 个月前。 我不确定我是否需要 lambda 或其他东西。但是,
C 中的 assert() 函数工作原理对我来说就像一片黑暗的森林。根据这里的答案https://stackoverflow.com/a/1571360 ,您可以使用以下构造将自定义消息输出到您的断言
在this页,John Barnes 写道: If the conditional expression is the argument of a type conversion then effec
我必须创建一个调度程序,它必须每周从第一天上午 9 点到第二天晚上 11 点 59 分运行 2 天(星期四和星期五)。为此,我需要提供一个 cron 表达式。 0-0 0-0 9-23 ? * THU
我正在尝试编写一个 Linq 表达式来检查派生类中的属性,但该列表由来自基类的成员组成。下面的示例代码。以“var list”开头的 Process 方法的第二行无法编译,但我不确定应该使用什么语法来
此 sed 表达式将输入字符串转换为两行输出字符串。两条输出行中的每一行都由输入的子串组成。第一行需要转换成大写: s:random_stuff\(choice1\|choice2\){\([^}]*
我正在使用 Quartz.Net 在我的应用程序中安排我的工作。我只是想知道是否可以为以下场景构建 CRON 表达式: Every second between 2:15AM and 5:20AM 最
我是一名优秀的程序员,十分优秀!