gpt4 book ai didi

java - 正则表达式删除两个单词之间的停用词

转载 作者:行者123 更新时间:2023-12-02 06:30:50 26 4
gpt4 key购买 nike

我有一组名为“stopwords”的单词。现在我需要匹配两个单词,但这些单词之间可以出现空格或“停用词”集中的单词,例如“能源的力量”、“能源的力量”、“能源的力量”、“能源的力量”。在停用词集中还有“for, of, the, ...”

我想获得没有停用词的“power energy”。可能吗?

最佳答案

找到子字符串就可以了。这将格式化表单中的任何短语

Word (stopwords)+ Endword to Word Endword

 String power = "power of energy";
String[] toks = power.split("[\\s]+"); // in case of extra space between words.

String removed =
power.substring(power.indexOf(toks[0]), power.indexOf(toks[0])
+ toks[0].length())
+ " " + power.substring(power.indexOf(toks[toks.length - 1]), power.indexOf(toks[toks.length - 1 ])
+ toks[toks.length - 1].length());

System.out.println(removed);

Output: power energy

方法

public static String removeStopWord(String phrase){
String[] toks = phrase.split("[\\s]+");

String removed =
phrase.substring(phrase.indexOf(toks[0]), phrase.indexOf(toks[0])
+ toks[0].length())
+ " " + phrase.substring(phrase.indexOf(toks[toks.length - 1]), phrase.indexOf(toks[toks.length - 1])
+ toks[toks.length - 1].length());
return removed;
}

关于java - 正则表达式删除两个单词之间的停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20069846/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com