- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我需要逐字比较两个字符串。类似于 diff,但用于单词,而不是行。
就像在维基百科中所做的那样 http://en.wikipedia.org/w/index.php?title=Horapollo&action=historysubmit&diff=21895647&oldid=21893459
结果我想返回两个单词索引数组,这两个数组在两个字符串中是不同的。
是否有任何适用于 .NET 的库/框架/standalone_methods 可以做到这一点?
附言我要比较几千字节的文本
最佳答案
实际上,您可能想要实现我们在 DNA 中使用的局部对齐/全局对齐算法的变体 sequence alignments .这是因为您可能无法对两个字符串进行逐字比较。即:
The quick brown fox jumps over the lazy dog
The quick fox jumps over the lazy dog
换句话说,如果您无法识别整个单词的插入和删除,您的比较算法可能会变得非常 sc(r)ewed。看看 Smith-Waterman 算法和 Needleman-Wunsch 算法,找到一种方法使它们适应您的需要。由于如果字符串很长,这样的搜索空间会变得非常大,您还可以查看 BLAST。 BLAST 是一种非常常见的启发式算法,几乎是遗传搜索的标准。
关于c# - .NET 中两个字符串的逐字差异比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1786364/
我正在尝试返回数组“seats”,它本质上应该从文本文件返回数据 - 15x30 网格“#”。我已经尝试了很多东西,但我感到很沮丧,因为我对 java 的经验很少。我的代码可以编译,但在调用该方法时无
对于任何输入的字符串,我们需要按任意顺序的单词匹配来查找 super 字符串。即输入字符串中的所有单词必须以任何顺序出现在输出字符串中。例如给定数据集:“字符串搜索”“Java 字符串搜索”“手动 C
我有一个文本文件,其中包含一些我想放入二维数组中的内容。该文本文件由等长的句子组成。如何将每个单词放入数组? 文本文件的例子是- This is stackoverflow I am user 这个文
我正在编写一个实用程序,它接受一个 .resx 文件并创建一个包含 .resx 文件中所有名称/值对属性的 javascript 对象。这一切都很好,直到 .resx 中的值之一是 该经销商接受电子订
我输入了大量的数学表达式和方程式,我想为每个表达式和方程式打印出 latex 表示形式。到目前为止,我已经尝试过 Sage 和 sympy,但棘手的部分是不对表达式中的术语重新排序。 所以,如果我的输
我正在尝试通过实现异步任务在 android (java) 中流式传输 chatgpt api 的响应(逐字),但我收到错误。我正在将 java 的 HTTPurlconnection 库与输入和输出
我正在尝试通过实现异步任务在 android (java) 中流式传输 chatgpt api 的响应(逐字),但我收到错误。我正在将 java 的 HTTPurlconnection 库与输入和输出
我是一名优秀的程序员,十分优秀!