- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在编写一个 Android 文字应用程序。我的代码包括一种方法,该方法可以找到字符串的所有组合和 7 个字母字符串的子字符串,最小长度为 3。然后将所有可用组合与字典中的每个单词进行比较以找到所有有效单词。我正在使用递归方法。这是代码。
// Gets all the permutations of a string.
void permuteString(String beginningString, String endingString) {
if (endingString.length() <= 1){
if((Arrays.binarySearch(mDictionary, beginningString.toLowerCase() + endingString.toLowerCase())) >= 0){
mWordSet.add(beginningString + endingString);
}
}
else
for (int i = 0; i < endingString.length(); i++) {
String newString = endingString.substring(0, i) + endingString.substring(i + 1);
permuteString(beginningString + endingString.charAt(i), newString);
}
}
// Get the combinations of the sub-strings. Minimum 3 letter combinations
void subStrings(String s){
String newString = "";
if(s.length() > 3){
for(int x = 0; x < s.length(); x++){
newString = removeCharAt(x, s);
permuteString("", newString);
subStrings(newString);
}
}
}
上面的代码运行良好,但是当我将它安装到我的 Nexus s 上时,我意识到它运行起来有点太慢了。需要几秒钟才能完成。大约 3 或 4 秒,这是 Not Acceptable 。现在我在手机上玩了一些文字游戏,它们立即计算出一个字符串的所有组合,这让我相信我的算法不是很有效并且可以改进。谁能帮忙?
public class TrieNode {
TrieNode a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z;
TrieNode[] children = {a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z};
private ArrayList<String> words = new ArrayList<String>();
public void addWord(String word){
words.add(word);
}
public ArrayList<String> getWords(){
return words;
}
}
public class Trie {
static String myWord;
static String myLetters = "afinnrty";
static char[] myChars;
static Sort sort;
static TrieNode myNode = new TrieNode();
static TrieNode currentNode;
static int y = 0;
static ArrayList<String> availableWords = new ArrayList<String>();
public static void main(String[] args) {
readWords();
getPermutations();
}
public static void getPermutations(){
currentNode = myNode;
for(int x = 0; x < myLetters.length(); x++){
if(currentNode.children[myLetters.charAt(x) - 'a'] != null){
//availableWords.addAll(currentNode.getWords());
currentNode = currentNode.children[myLetters.charAt(x) - 'a'];
System.out.println(currentNode.getWords() + "" + myLetters.charAt(x));
}
}
//System.out.println(availableWords);
}
public static void readWords(){
try {
BufferedReader in = new BufferedReader(new FileReader("c://scrabbledictionary.txt"));
String str;
while ((str = in.readLine()) != null) {
myWord = str;
myChars = str.toCharArray();
sort = new Sort(myChars);
insert(myNode, myChars, 0);
}
in.close();
} catch (IOException e) {
}
}
public static void insert(TrieNode node, char[] myChars, int x){
if(x >= myChars.length){
node.addWord(myWord);
//System.out.println(node.getWords()+""+y);
y++;
return;
}
if(node.children[myChars[x]-'a'] == null){
insert(node.children[myChars[x]-'a'] = new TrieNode(), myChars, x=x+1);
}else{
insert(node.children[myChars[x]-'a'], myChars, x=x+1);
}
}
}
最佳答案
在您当前的方法中,您要查找每个子字符串的每个排列。所以对于"abc"
,你需要查找"abc"
, "acb"
, "bac"
、“bca”
、“cab”
和 “cba”
。如果您想找到“排列”的所有排列,您的查找次数将近 500,000,000,而这甚至还没有查看其子字符串。但是我们可以通过预处理字典将其减少到一次 查找,而不管长度如何。
想法是将字典中的每个单词放入某种数据结构中,其中每个元素包含一组字符,以及包含(仅)这些字符的所有单词的列表。因此,例如,您可以构建一个二叉树,该树的节点包含(排序的)字符集 "abd"
和单词列表 ["bad", "dab"]
。现在,如果我们想找到 "dba"
的所有排列,我们将其排序为 "abd"
并在树中查找以检索列表。
正如 Baumann 指出的那样,tries非常适合存储此类数据。 trie 的美妙之处在于查找时间仅取决于搜索字符串的长度 - 它独立于字典的大小。由于您将存储相当多的单词,并且大部分搜索字符串都很小(大多数是来自递归最低级别的 3 个字符的子字符串),因此这种结构是理想的。
在这种情况下,您的 trie 中的路径将反射(reflect)字符集而不是单词本身。因此,如果您的整个字典是 ["bad", "dab", "cab", "cable"]
,您的查找结构最终将如下所示:
在您实现它的方式中有一点时间/空间的权衡。在最简单(也是最快)的方法中,每个 Node
仅包含单词列表和一个子数组 Node[26]
。这允许您在恒定时间内找到您要找的 child ,只需查看 children[s.charAt(i)-'a']
(其中 s
是你的搜索字符串和 i
是你当前在 trie 中的深度)。
缺点是您的大多数 children
数组大部分都是空的。如果空间是个问题,您可以使用更紧凑的表示形式,如链表、动态数组、哈希表等。但是,这些都是以可能需要在每个节点进行多次内存访问和比较为代价的,而不是简单的数组上面的访问。但是,如果整个字典中浪费的空间超过几兆字节,我会感到惊讶,因此基于数组的方法可能是您的最佳选择。
使用 trie 树后,您的整个排列函数将被一次查找替换,从而将复杂度从 O(N!log D) 降低(其中 D 是字典的大小,N 字符串的大小)到 O(N log N)(因为您需要对字符进行排序;查找本身是 O (N)).
编辑: 我拼凑了这个结构的一个(未经测试的)实现:http://pastebin.com/Qfu93E80
关于java字符串排列组合查找,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9138239/
我有一个 mysql 表,其中包含一些随机数字组合。为简单起见,以下表为例: index|n1|n2|n3 1 1 2 3 2 4 10 32 3 3 10 4 4
我有以下代码: SELECT sdd.sd_doc_classification, sdd.sd_title, sdd.sd_desc, sdr.sd_upl
如果我有两个要合并的数据框 Date RollingSTD 01/06/2012 0.16 01/07/2012 0.18 01/08/2012 0.17 01/09/20
我知道可以使用 lein ring war 创建一个 war 文件,但它似乎仍然包含码头依赖项。当我构建 war (并在 tomcat 上部署)时,有没有办法排除码头依赖项? 如果我根本不能做这件事,
维基百科关于封装的文章指出: “封装还通过防止用户将组件的内部数据设置为无效或不一致的状态来保护组件的完整性” 我在一个论坛上开始讨论封装,在那里我问你是否应该始终在 setter 和/或 gette
对于我使用的组合框内的复选框: AOEDComboAssociationName = new Ext.form.ComboBox({ id: 'AOEDComboAssociationName',
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How do I combine LINQ expressions into one? public boo
如何在 rust 中找到排列或组合的数量? 例如C(10,6) = 210 我在标准库中找不到这个函数,也找不到那里的阶乘运算符(这就足够了)。 最佳答案 以@vallentin 的回答为基础,可以进
我有一个复杂的泛型类型用例,已在下面进行了简化 trait A class AB extends A{ val v = 10 } trait X[T<:A]{ def request: T }
如何使用 Hibernate 限制来实现此目的? (((A='X') and (B in('X',Y))) or ((A='Y') and (B='Z'))) 最佳答案 思考有效 Criteria c
我一定会在我的一个项目中使用谷歌图表。我需要的是,显示一个条形图,并且在条形图中,与每个条形相交的线代表另一个值。如果您查看下面的 jsfiddle,您会发现折线图仅与中间的条形图相交,并继续向其他条
只是一个简单的问题,我也很想得到答案,因为我不能百分百理解 Javascript 示例:假设您提示用户输入名称。够简单吧?但是你有一个数组,上面写着一些名字(其中之一就是),基本上就是我到目前为止所说
我试图通过 Haskell 理解函数式编程,但在处理函数组合时遇到了很多麻烦。 其实我有这两个功能: add:: Integer -> Integer -> Integer add x y = x
我正在寻找一种在 Realm 查询中组合 AND 和 OR 的方法。 这是我的课: class Event extends RealmObject { String id; String
例如,我有一个包含 5 个元素的哈希: my_hash = {a: 'qwe', b: 'zcx', c: 'dss', d: 'ccc', e: 'www' } 我的目标是每次循环哈希时都返回,但没
我是Combine 的新手,我想得到一个看似简单的东西。假设我有一个整数集合,例如: let myCollection = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 我想以例如 0
关于“优先组合而不是继承”的问题,我的老师是这样说的: 组合:现有类成为新类的组件 转发:新类中的每个实例方法,在现有类的包含实例上调用相应的方法并返回结果 包装器:新类封装了现有的 这三个概念我不是
我正在尝试将单个整数从 ASCII 值转换为 0 和 1。相关代码如下所示: int num1 = bin.charAt(0); int num2 = bin.charAt(1);
这个问题已经有答案了: What is a NullPointerException, and how do I fix it? (12 个回答) 已关闭 7 年前。 我经常看到“嵌套”类中的非静态变
我尝试合并两个数据集(DataFrame),如下所示: D1 = pd.DataFrame({'Village':['Ampil','Ampil','Ampil','Bachey','Bachey',
我是一名优秀的程序员,十分优秀!