gpt4 book ai didi

java - Java 中处理空格和撇号的分词器

转载 作者:行者123 更新时间:2023-11-30 04:52:21 26 4
gpt4 key购买 nike

我想知道Java中是否有任何方法可以通过空格标记字符串,但是如果撇号之间有一些单词,请将其视为“一个单词”...

例如,如果我有:

This "is a great" day

字符串标记器应该具有:

  • “这个”
  • “太棒了”
  • “日”

谢谢!

最佳答案

使用String.split()和正则表达式,而不是StringTokenizer,怎么样:

    String input = "this \"is a great\" day";

for (String word: input.split("(?<=\").+(?=\")|\\b\\w+\\b"))
{
System.out.println("["+word+"]");
}

输出:

[this]
[is a great]
[day]

根据您的示例,我假设您的意思是双引号 (") 而不是撇号 (')。

注意:我最初发布了一些更简单的内容,它适用于您的示例,但不适用于如下输入:

" yes this \"is a great\" day all right"

关于java - Java 中处理空格和撇号的分词器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9559780/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com