gpt4 book ai didi

java - 需要从java文件中写入的字符串中删除特殊字符

转载 作者:行者123 更新时间:2023-12-02 13:41:14 24 4
gpt4 key购买 nike

我有一个包含数据的文本文件。文件中出现一些特殊字符。我需要删除所有“特殊”字符,即:

],à,>,¤,`,ƒ,Š,¥,Œ,^,>¤,°,ã,Ãé,–«»°,NÂ,N,º,?¿Ññ,ß,ä,º,ô5,ª,é ,ª,§,Á

这些需要用空间聊天替换,而不是删除。

我有一个限制,即必须将输出存储在字符串中,因为我需要在 TIBCO 中进一步传递该字符串。我编写了以下代码,但它删除了所有内容。因为我需要在文件中包含 + 和 - 符号。

str = str.replaceAll("[^\\w\\s]*", "");

感谢任何帮助。

最佳答案

首先,如果您需要替换为空格而不是空白,为什么要替换为空白?

您可以通过向字符类添加加号和减号来使用要保留的所有字符的白名单:

.replaceAll("[^\\w\\s.,+-]", " ")

我还添加了点和逗号,因为您可能也需要这些。

但看起来毯子字符会更好,因为您不需要的所有字符都在 127 以上:

.replaceAll("[\u0080-\uffff]", " ")

您可以根据需要向此字符类添加您不想要的其他字符。

注意:在这两种情况下,我都删除了量词 *,因为您需要一对一的替换。如果您使用 * 正则表达式将在每个字符之间进行匹配,并匹配一系列不需要的字符,这会弄乱您的文件。

关于java - 需要从java文件中写入的字符串中删除特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42736046/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com