- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
您好,我正在尝试创建一种非常快速的算法来检测集合中的关键字或关键字列表。
在此之前,我已经阅读了很多 stackoverflow(和其他)帖子,但无法将性能提高到我期望的水平。
我当前的解决方案能够在 0.1825 毫秒内分析 200 个字符的输入 和 400 个列表的集合(在 1 毫秒内分析 5 个输入),但这太长了,我希望将此性能提高至少 5 倍(这是我的要求)。
解决方案测试:
当前解决方案:
input (string) : 要解析和分析的字符串,以验证其中包含的关键字列表。示例:“世界您好!#piloupe 先生,您好吗?”。
tracks (string[]) :我们要匹配的字符串数组(空格表示 AND)。示例:“hello world”匹配包含“hello”和“world”的字符串,无论它们位于何处
keywordList (string[][]) :要从输入中匹配的字符串列表。示例:{{“你好”},{“#piloupe”},{“你好”,“世界”}}
uniqueKeywords (string[]) :表示关键字列表中所有唯一关键字的字符串数组。使用之前的关键字列表将是:{ "hello", "#piloupe", "world"}
所有这些先前的信息不需要任何性能改进,因为它们对任何输入只构建一次。
查找轨道算法:
// Store in the class performing the queries
readonly Regex _regexToGetAllInputWords = new Regex(@"\#\w+|\w+", RegexOptions.Compiled);
List<string> GetInputMatches(input)
{
// Extract all the words from the input
var inputWordsMatchCollection = _regexToGetAllInputWords.Matches(input.ToLower()).OfType<Match>().Select(x => x.Value).ToArray();
// Get all the words from the input matching the tracked keywords
var matchingKeywords = uniqueKeywords.Intersect(inputWordsMatchCollection).ToArray();
List<string> result = new List<string>();
// For all the tracks check whether they match
for (int i = 0; i < tracksKeywords.Length; ++i)
{
bool trackIsMatching = true;
// For all the keywords of the track check whether they exist
for (int j = 0; j < tracksKeywords[i].Length && trackIsMatching; ++j)
{
trackIsMatching = matchingKeywords.Contains(tracksKeywords[i][j]);
}
if (trackIsMatching)
{
string keyword = tracks[i];
result.Add(keyword);
}
}
return result;
}
任何帮助将不胜感激。
最佳答案
简短的回答是解析每个单词,并将其存储到类似二叉树的集合中。 SortedList或 SortedDictionary 将是您的 friend 。
只需很少的代码,您就可以将单词添加到 SortedList,然后对该 SortedList 执行 .BinarySearch()。这是一个 O(log n) 实现,您应该能够在几次迭代中搜索数千或数百万个单词。使用 SortedList 时,性能问题将出现在对 SortedList 的插入上(因为它会在插入时进行排序)。但这是进行二分查找所必需的。
我不会为线程而烦恼,因为您需要不到 1 毫秒的结果。
长的答案是看像 Lucene 这样的东西,如果你正在做一个自动完成式的搜索,它会特别有用。 RavenDB 在幕后使用 Lucene,可以为您进行后台索引,它将在几毫秒内搜索数百万条记录。
关于c# - C#中查找关键字最快的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18830388/
如果我创建一个对象时没有使用 new 关键字,例如“Object s(someval)”,但该对象的构造函数使用了 new,当该对象超出范围时,是否会调用析构函数为其分配新的空间?我感觉好像是,但我不
在 SQL 语法中,我发现奇怪的规则表明 select * from ONLY (t1)是有效的 SQL。 我的问题是:什么是 ONLY在这种情况下是什么意思? 它在规范的“7.6 table ref
为什么使用 $(this) 而不是重新选择类很重要? 我在代码中使用了大量的动画和 CSS 编辑,并且我知道可以使用 $(this) 来简化它。 最佳答案 当您通过 jQuery 执行 DOM 查询(
我正在尝试使用 IN 关键字编写查询。 表A 属性标识、属性名称 表B key 、属性标识、属性值 根据提供的 key ,我想返回所有 attrName、attrVal 组合。结果将包含两个表中的列。
这个问题在这里已经有了答案: Why would you use "AS" when aliasing a SQL table? (8 个答案) 关闭 9 年前。 我不擅长写查询,但是从我开始使用
我读过,在 Java 中,您不必将 this 关键字显式绑定(bind)到对象,它由解释器完成。它与 Javascript 相反,在 Javascript 中你总是必须知道 this 的值。但是 Ja
Swift 中“with”关键字的用途是什么?到目前为止,我发现如果您需要覆盖现有的全局函数,例如 toDebugString,可以使用该关键字。 // without "with" you
这个问题在这里已经有了答案: What does the keyword "where" in a class declaration do? (7 个答案) 关闭 9 年前。 在下面的一段代码中(
免责声明:swift 菜鸟 您好,我刚刚开始学习 Swift,正在学习 Swift 编程语言(Apple 在 WWDC 期间发布的书籍),并且想知道“where”关键字是什么。它用于 let vege
深入研究文档后,我找不到以下问题的答案: 是否有任何理由反对使用 this 来引用当前对象,如下例所示? type MyStruct struct { someField string } fun
前言 最近在做THINKPHP开发项目中,用到了 parent:: 关键字,实际上 parent::关键字 是PHP中常要用到的一个功能,这不仅仅是在 THINKPHP 项目开发中,即使是一个小型
我们都知道且经常用到 unsigned 关键字,但有没有想过,与此对应的 signed 关键字有啥用? 复制代码 代码如下: int i = 0; signed
this关键字再java里面是一个我认为非常不好理解的概念,:)也许是太笨的原因 this 关键字的含义:可为以调用了其方法的那个对象生成相应的句柄。 怎么理解这段话呢? thinking i
一 什么是 synchronized synchronized 关键字提供了一种锁机制,能够确保共享变量互斥访问,从而防止数据不一致问题的出现。 synchronized 关键字包括 monitor
最近看了几篇 synchronized 关键字的相关文章,收获很大,想着总结一下该关键字的相关内容。 1、synchronized 的作用 原子性:所谓原子性就是指一个操作或者多个操作,要么全部执行并
在本教程中,您将借助示例了解 JavaScript 对象方法和 this 关键字。 在 JavaScript 中,对象也可以包含函数。例如, // object containing meth
有人可以解释一下 PHP“with”的作用吗? 示例开始: 假设我有一个类: \App\fa_batch 这句话有什么区别: $w = (with (new \App\fa_batch))
这个问题在这里已经有了答案: What is the difference between using the colon and as syntax for declaring type? (2
如果我在 WHERE 子句中使用以下任一项,是否会有很大不同: WHERE [Process Code] = 1 AND ([Material ID] = 'PLT' OR [Material ID]
This question is unlikely to help any future visitors; it is only relevant to a small geographic are
我是一名优秀的程序员,十分优秀!