- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我写了一个简单的字符串搜索算法,我想改进,我应该从哪里开始?
之所以要改简单的算法是:
pool
好像是个大数组toSearch
中的字符串似乎是长字符串代码如下:
var pool []string = []string{"st", "se", "go", "es", "per", "123", "abcd", "e", "2"}
func search(aStr string) (index int) {
for i, s := range pool {
if strings.Contains(aStr, s) {
return i
}
}
return -1
}
func main() {
toSearch := []string{"string", "search", "algorithm", "best", "performance"}
for _, s := range toSearch {
idx := search(s)
fmt.Printf("search %s in %d(%s)\n", s, idx, pool[idx])
}
}
最佳答案
您可以使用一个特殊字符将所有字符串连接到 toSearch 数组中,比如 $
,那么您的搜索字符串将变为 "string$search$algorithm$best$performance"
,您可能还需要分配一个数组,如果您找到匹配项,它将记录您当前所在的字符串。
恐怕对于池数组,您将不得不一个一个地搜索上面创建的字符串。
降低复杂性的方法之一是对池数组的每个元素使用线性时间模式匹配算法,而不是您使用的二次时间模式匹配算法。
我已经发布了 3 个线性时间算法来搜索给定字符串中的模式,其中 2 个是确定性的,最后一个是非确定性的。
确定性和更标准的解决方案之一是使用 Knuth Morris Pratt algorithm尽管理解起来有点复杂,但您可以轻松地找到在线实现它的代码。它是线性时间,其中m是输入字符串的长度,n是模式的长度。
另一种确定性算法,也是我最喜欢的算法之一,它是 Z 算法更容易理解和实现,也是线性时间,它构造了所谓的 Z 数组,即用于轻松计算字符串中的模式匹配。您可以在 Z Algorithm 上查看此链接
如果要使用非确定性算法,可以使用Rabin Karp algorithm ,它需要散列(特别是 Rolling Hash 的概念)并且它最容易实现并且是线性时间。如果您检查使用散列得到的字符串是否由于冲突而正确或不正确,它也可以是确定性的,但在最坏的情况下,如果您使 rabin karp 算法具有确定性,它会产生二次复杂度。
我已经使用下面的 Z 算法编写了一个 C++ 代码:
#include<iostream>
#include<string>
using namespace std;
string s, temp;
int n, Z[1000];
int toSearchSize, poolSize, lookUpIndex[1000];
string toSearch[5] = {"string", "search", "algorithm", "best", "performance"};
string pool[9] = {"st", "se", "go", "es", "per", "123", "abcd", "e", "2"};
void joinString(){
int idx = 0;
for(int i = 0;i < toSearchSize;i++){
s += toSearch[i];
for(int j = idx;j <= idx+toSearch[i].size();j++) lookUpIndex[j] = i;
s += "$";
idx += toSearch[i].size()+1;
}
temp = s;
}
void zval(){
int L = 0, R = 0;
for(int i = 1;i<n;i++){
if(i > R){
L = R = i;
while(R < n && s[R-L] == s[R]) R++;
Z[i] = R-L;R--;
}else{
int b = R-i+1;
if(Z[i-L] < b) Z[i] = Z[i-L];
//else if(Z[i-L] > b) Z[i] = b;
else{
L = i;
while(R < n && s[R-L] == s[R]) R++;
Z[i] = R-L;R--;
}
}
}
}
int main(){
toSearchSize = 5, poolSize = 9;
joinString();
for(int i = 0;i < poolSize;i++){
for(int j = 0;j < n;j++) Z[j] = 0;
s = pool[i] + temp;
n = s.size();
zval();
for(int j = pool[i].size();j < n;j++){
if(Z[j] >= pool[i].size()){
cout << "Match Found for : " << pool[i] << " in string : " << toSearch[lookUpIndex[j]] << endl;
}
}
}
return 0;
}
以上代码的输出:
Match Found for : st in string : string
Match Found for : st in string : best
Match Found for : se in string : search
Match Found for : go in string : algorithm
Match Found for : es in string : best
Match Found for : per in string : performance
Match Found for : e in string : search
Match Found for : e in string : best
Match Found for : e in string : performance
Match Found for : e in string : performance
Ideone 解决方案链接:http://ideone.com/UGJR3i
关于string - 在数组中找到第一个字符串匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35909563/
如何使用 SPListCollection.Add(String, String, String, String, Int32, String, SPListTemplate.QuickLaunchO
我刚刚开始使用 C++ 并且对 C# 有一些经验,所以我有一些一般的编程经验。然而,似乎我马上就被击落了。我试过在谷歌上寻找,以免浪费任何人的时间,但没有结果。 int main(int argc,
这个问题已经有答案了: In Java 8 how do I transform a Map to another Map using a lambda? (8 个回答) Convert a Map>
我正在使用 node + typescript 和集成的 swagger 进行 API 调用。我 Swagger 提出以下要求 http://localhost:3033/employees/sear
我是 C++ 容器模板的新手。我收集了一些记录。每条记录都有一个唯一的名称,以及一个字段/值对列表。将按名称访问记录。字段/值对的顺序很重要。因此我设计如下: typedef string
我需要这两种方法,但j2me没有,我找到了一个replaceall();但这是 replaceall(string,string,string); 第二个方法是SringBuffer但在j2me中它没
If string is an alias of String in the .net framework为什么会发生这种情况,我应该如何解释它: type JustAString = string
我有两个列表(或字符串):一个大,另一个小。 我想检查较大的(A)是否包含小的(B)。 我的期望如下: 案例 1. B 是 A 的子集 A = [1,2,3] B = [1,2] contains(A
我有一个似乎无法解决的小问题。 这里...我有一个像这样创建的输入... var input = $(''); 如果我这样做......一切都很好 $(this).append(input); 如果我
我有以下代码片段 string[] lines = objects.Split(new string[] { "\r\n", "\n" }, StringSplitOptions.No
这可能真的很简单,但我已经坚持了一段时间了。 我正在尝试输出一个字符串,然后输出一个带有两位小数的 double ,后跟另一个字符串,这是我的代码。 System.out.printf("成本:%.2
以下是 Cloud Firestore 列表查询中的示例之一 citiesRef.where("state", ">=", "CA").where("state", "= 字符串,我们在Stack O
我正在尝试检查一个字符串是否包含在另一个字符串中。后面的代码非常简单。我怎样才能在 jquery 中做到这一点? function deleteRow(locName, locID) { if
这个问题在这里已经有了答案: How to implement big int in C++ (14 个答案) 关闭 9 年前。 我有 2 个字符串,都只包含数字。这些数字大于 uint64_t 的
我有一个带有自定义转换器的 Dozer 映射: com.xyz.Customer com.xyz.CustomerDAO customerName
这个问题在这里已经有了答案: How do I compare strings in Java? (23 个回答) 关闭 6 年前。 我想了解字符串池的工作原理以及一个字符串等于另一个字符串的规则是
我已阅读 this问题和其他一些问题。但它们与我的问题有些无关 对于 UILabel 如果你不指定 ? 或 ! 你会得到这样的错误: @IBOutlet property has non-option
这两种方法中哪一种在理论上更快,为什么? (指向字符串的指针必须是常量。) destination[count] 和 *destination++ 之间的确切区别是什么? destination[co
This question already has answers here: Closed 11 years ago. Possible Duplicates: Is String.Format a
我有一个Stream一个文件的,现在我想将相同的单词组合成 Map这很重要,这个词在 Stream 中出现的频率. 我知道我必须使用 collect(Collectors.groupingBy(..)
我是一名优秀的程序员,十分优秀!