gpt4 book ai didi

java - 如何使用正则表达式删除句子中的标点符号

转载 作者:太空宇宙 更新时间:2023-11-04 08:24:15 26 4
gpt4 key购买 nike

我正在尝试从文件中获取所有有效单词。有效单词被定义为正常字符,如下所示:

don't won't can't

我必须忽略逗号句号和感叹号。

我已经得到了仅获取字符的表达式,但现在它不会得到像 don't 和 can't 或 won't 这样的词。

这是我正在使用的表达式 "[^A-Za-z]+" 并且我尝试过 "\'[^A-Za-z]+" 但这会破坏并允许所有字符。有谁知道我可以用什么来获得正常的单词,包括“不”、“不会”、“不能”等单词。

非常感谢

最佳答案

[^A-Za-z] 表示任何不匹配这些字符范围的内容!试试这个:

[A-Za-z']

您可能需要转义单引号,在这种情况下,您可能需要转义转义单引号的斜杠:

[A-Za-z\\']

关于java - 如何使用正则表达式删除句子中的标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8921729/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com