gpt4 book ai didi

Java - 删除所有语言的字符串的所有非单词字符

转载 作者:行者123 更新时间:2023-11-30 03:55:24 24 4
gpt4 key购买 nike

我需要从java中的单词中删除所有标点符号,我尝试过这个

    System.out.println("do.,it".replaceAll("[^\\w]", ""));
System.out.println("сказочники".replaceAll("[^\\w]", ""));

但它不适用于基里尔文或其他语言。我已经尝试过合作

\p{Punct}

但是这个列表并不完整,例如

„ and »

失踪了

最佳答案

不确定java是否支持这个,但尝试一下:

"сказочники".replaceAll("\P{wd}+", "")

其中 \P{wd} 代表任何语言中的任何非单词字符。它与 \p{wd}

相反

关于Java - 删除所有语言的字符串的所有非单词字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23350997/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com