- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在寻找 List<T>.IndexOf(List<T>)
的实现.我只找到了 List<<T>.IndexOf(T)
在 .NET 类库中。
我有一个 List longList
和一个 List possibleSubList
.我想知道 possibleSubList
可以在 longList
中作为子“字符串”找到,如果是,索引到 longList
.
这与 System.String.IndexOf
的语义基本相同.任何人都知道如何调用它或者它是否有很好的实现方式?
伪代码示例:
{1, 2, 3, 9, 8, 7}.IndexOf({3, 9, 8}) = 2<br/>
{1, 2, 3, 9, 8, 7}.IndexOf({1, 2, 3, 9, 8, 7}) = 0<br/>
{1, 2, 3, 9, 8, 7}.IndexOf({2, 9}) = -1 (not found)<br/>
澄清:我已经有了一个直接的实现(两个嵌套的 for 循环),但我的列表相当长,而且这是一个性能敏感区域。我希望找到比我的 ~O(m*n) 更有效的实现。
最佳答案
线性 Z 索引 可能是当今最快的子列表搜索算法之一,其模式相同且语料库是动态的,具有真正的 O(n) 复杂度(小字母,由于 ZIndexing 提供了大量跳过索引的机会,因此它的性能比你对 O(n) 的预期要好得多:
我在中央佛罗里达大学的 Shaojie Zhang 的指导下,在遗传算法课上编写了我的实现。我已将算法改编为 C#,特别是使用通用 IList<T>
,如果您决定使用它,请给予信任。这些技术的研究可用here ,具体看讲义here .
无论如何,我已经提供了代码 here
在 TestZIndexing.cs 中查看有关如何执行搜索的示例(在本例中是字符序列,但使用泛型,您应该能够使用任何带有相等运算符的内容)。
用法很简单:
IEnumerable<int> LinearZIndexer.FindZ<T>(
IList<T> patternSequence, IList<T> sourceSequence, bool bMatchFirstOnly)
where T: IComparable;
而且,由于一些 DNA 是环状的,我有一个环状变体:
IEnumerable<int> LinearZIndexer.FindZCircular<T>(
IList<T> patternSequence, IList<T> sourceSequence, bool bMatchFirstOnly)
where T: IComparable;
让我们做得更快:后缀树
或者,如果您想获得比 O(n) 更好的性能,您可以通过使用后缀树获得 O(m),其中 m 是模式列表的大小。当模式发生变化并且语料库保持不变时(与前一种情况相反),这会起作用。查看我为 TestSuffixTree.cs
贡献的同一个库.这里唯一的区别是你必须提前构建后缀树,所以它肯定是针对大型语料库的多模式搜索,但我提供了一个 O(n) 和 Space(n) 的算法来构建后缀树。
调用同样简单,而且可以使用任何提供 IComparable 的东西:
string strTest = "bananabananaorangebananaorangebananabananabananaban";
string[] strFind = {"banana", "orange", "ban"};
// I use char, but you can use any class or primitive that
// supports IComparable
var tree = new SuffixTree<char>();
tree.BuildTree(strTest.ToCharArray());
var results = tree.Find(str.ToCharArray());
foreach(var r in results) Console.WriteLine(r);
享受吧。
关于c# - String.IndexOf 的 IList<T> 版本(找到一个子 -'string' ,而不仅仅是单个对象),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7067436/
如果您想使用 String.Concat() 连接 5 个或更多字符串,则它会使用 Concat(String[])。 为什么不一直使用 Concat(String[]) 而不再需要 Concat(S
今天在使用 String 时,我遇到了一种我以前不知道的行为。我无法理解内部发生的事情。 public String returnVal(){ return "5";
似乎在我所看到的任何地方,都有一些过时的版本,这些版本不再起作用。 我的问题似乎很简单。我有一个Java类,它映射到derby数据库。我正在使用注释,并且已经成功地在数据库中创建了所有其他表,但是在这
一、string::size_type() 在C++标准库类型 string ,在调用size函数求解string 对象时,返回值为size_type类型,一种类似于unsigned类型的int 数据
我正在尝试将数据保存到我的 plist 文件中,其中包含字符串数组的定义。我的plist - enter image description here 我将数据写入 plist 的代码是 -- let
我有一个带有键/值对的 JavaScript 对象,其中值是字符串数组: var errors = { "Message": ["Error #1", "Error #2"], "Em
例如,为了使用相同的函数迭代 List 和 List> ,我可以编写如下内容: import java.util.*; public class Test{ public static voi
第一个Dictionary就像 Dictionary ParentDict = new Dictionary(); ParentDict.Add("A_1", "1")
这是我的 jsp 文件: 我遇到了错误 The method replace(String, String, String) in the type Functions is not appl
我需要一些帮助。我有一个方法应该输出一个包含列表内容的 txt 文件(每行中的每个项目)。列表项是字符串数组。问题是,当我调用 string.Join 时,它返回文字字符串 "System.Strin
一位同事告诉我,使用以下方法: string url = "SomeURL"; string ext = "SomeExt"; string sub = "SomeSub"; string s
给定类: public class CategoryValuePair { String category; String value; } 还有一个方法: public
我正在尝试合并 Stream>>对象与所有 Streams 中的键一起映射到单个映射中. 例如, final Map someObject; final List>> list = someObjec
在这里使用 IDictionary 的值(value)是什么? 最佳答案 使用接口(interface)的值(value)始终相同:切换到另一个后端实现时,您不必更改客户端代码。 请考虑稍后分析您的代
我可以知道这两个字典声明之间的区别吗? var places = [String: String]() var places = [Dictionary()] 为什么当我尝试以这种方式附加声明时,只有
在 .NET 4.0 及更高版本中存在 string.IsNullOrWhiteSpace(string) 时,在检查字符串时使用 string.IsNullOrEmpty(string) 是否被视为
这个名字背后的原因是什么? SS64在 PowerShell 中解释此处的字符串如下: A here string is a single-quoted or double-quoted string
我打算离开 this 文章,尝试编写一个接受字符串和 &str 的函数,但我遇到了问题。我有以下功能: pub fn new(t_num: S) -> BigNum where S: Into {
我有一个结构为 [String: [String: String]] 的多维数组。我可以使用 for 循环到达 [String: String] 位,但我不知道如何访问主键(这个位 [String:
我正在尝试使用 sarama(管理员模式)创建主题。没有 ConfigEntries 工作正常。但我需要定义一些配置。 我设置了主题配置(这里发生了错误): tConfigs := map[s
我是一名优秀的程序员,十分优秀!