gpt4 book ai didi

即使很少出现空格,Java也会从文件中过滤掉单词

转载 作者:行者123 更新时间:2023-11-30 07:29:08 26 4
gpt4 key购买 nike

我正在为学校做一项大数据作业,为了使我的代码正常工作,我需要从文本文件中过滤掉单词。

当然,我阅读了文件并使用replaceAll(“[^a-zA-Z0-9]”,“”);过滤了我不需要的东西;

但这带来了一个问题。因为我过滤空格,并且有一些特殊情况,例如:

wobbewy!'--'Wobbewy,'

我得到这样的词:

wobbewywobbewy

是否有办法过滤空格上的单词并过滤掉这些特殊情况,而无需使用大量的 if 语句?

尝试修复后发生的情况的示例代码:

while ((thisLine = bufferedReader.readLine()) != null) {
String[] woord = thisLine.toString().trim().split("\\s+");
for(int i=0; i<woord.length; i++){
normalWord = woord[i].replaceAll("[^a-zA-Z]+", " ");
normalWord = normalWord.toLowerCase();

然后我得到如下输出:

xxv(多个空格)我的

最佳答案

删除特殊字符时,有关单词边框的信息会丢失。

replaceAll("[^a-zA-Z0-9]", ""); 更改为 replaceAll("([^a-zA-Z0-9]|\s)+", "");(将特殊字符和空格替换为单个空格)。

关于即使很少出现空格,Java也会从文件中过滤掉单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36389877/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com