gpt4 book ai didi

c - 这个数组比较问题的最佳算法是什么?

转载 作者:太空狗 更新时间:2023-10-29 16:36:22 24 4
gpt4 key购买 nike

解决下列问题最有效的速度算法是什么?

给定 6 个数组,D1、D2、D3、D4、D5 和 D6,每个数组包含 6 个数字,例如:

D1[0] = number              D2[0] = number      ......       D6[0] = number
D1[1] = another number D2[1] = another number ....
..... .... ...... ....
D1[5] = yet another number .... ...... ....

给定第二个数组 ST1,包含 1 个数字:

ST1[0] = 6

给定第三个数组 ans,包含 6 个数字:

ans[0] = 3, ans[1] = 4, ans[2] = 5, ......ans[5] = 8

用作数组 D1、D2、D3、D4、D5 和 D6 的索引,从 0 到存储在 ST1[0] 中的数字减一,在本例中为 6,因此从 0 到 6 -1,将 ans 数组与每个 D 数组进行比较。如果在同一索引处的任何 D 中未找到一个或多个 ans 编号,则结果应为 0;如果在同一索引处的某个 D 中找到所有 ans 编号,则结果应为 1。也就是说,如果某些 ans[i] 不等于任何 DN[i] 则返回 0,如果每个 ans[i] 等于某些 DN[i] 则返回 1 ].

到目前为止我的算法是:
我试图尽可能地保持所有内容不循环。

EML  := ST1[0]   //number contained in ST1[0]   
EML1 := 0 //start index for the arrays D

While EML1 < EML
if D1[ELM1] = ans[0]
goto two
if D2[ELM1] = ans[0]
goto two
if D3[ELM1] = ans[0]
goto two
if D4[ELM1] = ans[0]
goto two
if D5[ELM1] = ans[0]
goto two
if D6[ELM1] = ans[0]
goto two

ELM1 = ELM1 + 1

return 0 //If the ans[0] number is not found in either D1[0-6], D2[0-6].... D6[0-6] return 0 which will then exclude ans[0-6] numbers


two:

EML1 := 0 start index for arrays Ds
While EML1 < EML
if D1[ELM1] = ans[1]
goto three
if D2[ELM1] = ans[1]
goto three
if D3[ELM1] = ans[1]
goto three
if D4[ELM1] = ans[1]
goto three
if D5[ELM1] = ans[1]
goto three
if D6[ELM1] = ans[1]
goto three
ELM1 = ELM1 + 1

return 0 //If the ans[1] number is not found in either D1[0-6], D2[0-6].... D6[0-6] return 0 which will then exclude ans[0-6] numbers

three:

EML1 := 0 start index for arrays Ds

While EML1 < EML
if D1[ELM1] = ans[2]
goto four
if D2[ELM1] = ans[2]
goto four
if D3[ELM1] = ans[2]
goto four
if D4[ELM1] = ans[2]
goto four
if D5[ELM1] = ans[2]
goto four
if D6[ELM1] = ans[2]
goto four
ELM1 = ELM1 + 1

return 0 //If the ans[2] number is not found in either D1[0-6], D2[0-6].... D6[0-6] return 0 which will then exclude ans[0-6] numbers

four:

EML1 := 0 start index for arrays Ds

While EML1 < EML
if D1[ELM1] = ans[3]
goto five
if D2[ELM1] = ans[3]
goto five
if D3[ELM1] = ans[3]
goto five
if D4[ELM1] = ans[3]
goto five
if D5[ELM1] = ans[3]
goto five
if D6[ELM1] = ans[3]
goto five
ELM1 = ELM1 + 1

return 0 //If the ans[3] number is not found in either D1[0-6], D2[0-6].... D6[0-6] return 0 which will then exclude ans[0-6] numbers


five:

EML1 := 0 start index for arrays Ds

While EML1 < EML
if D1[ELM1] = ans[4]
goto six
if D2[ELM1] = ans[4]
goto six
if D3[ELM1] = ans[4]
goto six
if D4[ELM1] = ans[4]
goto six
if D5[ELM1] = ans[4]
goto six
if D6[ELM1] = ans[4]
goto six
ELM1 = ELM1 + 1

return 0 //If the ans[4] number is not found in either D1[0-6], D2[0-6].... D6[0-6] return 0 which will then exclude ans[0-6] numbers

six:

EML1 := 0 start index for arrays Ds

While EML1 < EML
if D1[ELM1] = ans[5]
return 1 ////If the ans[1] number is not found in either D1[0-6].....
if D2[ELM1] = ans[5] return 1 which will then include ans[0-6] numbers
return 1
if D3[ELM1] = ans[5]
return 1
if D4[ELM1] = ans[5]
return 1
if D5[ELM1] = ans[5]
return 1
if D6[ELM1] = ans[5]
return 1
ELM1 = ELM1 + 1

return 0

作为首选语言,它将是纯 c

最佳答案

我对原发帖者提供的算法进行了直接简单的 C 实现。是here

正如其他人所建议的那样,要做的第一件事就是汇总代码。展开对速度来说并不是很好,因为它会导致代码缓存未命中。我开始滚动内部循环并得到 this .然后我滚动外循环并删除现在无用的 goto 并得到下面的代码。

编辑:我多次更改了 C 代码,因为即使它很简单,在使用 CUDA 进行 JIT 编译或执行时似乎也会出现问题。 (而且 CUDA 似乎对错误不是很冗长)。这就是为什么下面的代码使用全局变量……这只是简单的实现。我们还没有追求速度。它说了很多关于过早优化的内容。如果我们甚至不能使它工作,为什么还要费心让它变快呢?我想仍然存在问题,因为如果我相信维基百科的文章,CUDA 似乎对您可以使用的代码施加了许多限制。另外也许我们应该使用 float 而不是 int ?

#include <stdio.h>

int D1[6] = {3, 4, 5, 6, 7, 8};
int D2[6] = {3, 4, 5, 6, 7, 8};
int D3[6] = {3, 4, 5, 6, 7, 8};
int D4[6] = {3, 4, 5, 6, 7, 8};
int D5[6] = {3, 4, 5, 6, 7, 8};
int D6[6] = {3, 4, 5, 6, 7, 9};
int ST1[1] = {6};
int ans[6] = {1, 4, 5, 6, 7, 9};
int * D[6] = { D1, D2, D3, D4, D5, D6 };

/* beware D is passed through globals */
int algo(int * ans, int ELM){
int a, e, p;

for (a = 0 ; a < 6 ; a++){
for (e = 0 ; e < ELM ; e++){
for (p = 0 ; p < 6 ; p++){
if (D[p][e] == ans[a]){
goto cont;
}
}
}
return 0; //bad row of numbers found
cont:;
}
return 1;
}

int main(){
int res;
res = algo(ans, ST1[0]);
printf("algo returned %d\n", res);
}

这很有趣,因为我们可以理解代码在做什么。顺便说一句,在做这个打包工作时,我纠正了原始问题中的几个奇怪之处。我认为这是拼写错误,因为它在全局范围内根本不合逻辑。- goto 总是跳到两个(它应该已经进步了)- 最后的测试检查了 ans[0] 而不是 ans[5]

请马克,如果我在上述关于原始代码应该做什么的假设中有误并且您的原始算法没有拼写错误,请纠正我。

代码对 ans 中的每个值执行的操作检查它是否存在于二维数组中。如果未命中任何数字,则返回 0。如果找到所有数字,则返回 1。

要获得真正快速的代码,我要做的不是用 C 语言而是用另一种语言,如 python(或 C++),其中 set 是标准库提供的基本数据结构。然后我会用数组的所有值构建一个集合(即 O(n))并检查搜索的数字是否存在于集合中(即 O(1))。至少从算法的角度来看,最终实现应该比现有代码更快。

下面是 Python 示例,因为它非常简单(打印 true/false 而不是 1/0,但你明白了):

ans_set = set(ans)
print len(set(D1+D2+D3+D4+D5+D6).intersection(ans_set)) == len(ans_set)

这是一个使用集合的可能的 C++ 实现:

#include <iostream>
#include <set>

int algo(int * D1, int * D2, int * D3, int * D4, int * D5, int * D6, int * ans, int ELM){
int e, p;
int * D[6] = { D1, D2, D3, D4, D5, D6 };
std::set<int> ans_set(ans, ans+6);

int lg = ans_set.size();

for (e = 0 ; e < ELM ; e++){
for (p = 0 ; p < 6 ; p++){
if (0 == (lg -= ans_set.erase(D[p][e]))){
// we found all elements of ans_set
return 1;
}
}
}
return 0; // some items in ans are missing
}

int main(){
int D1[6] = {3, 4, 5, 6, 7, 8};
int D2[6] = {3, 4, 5, 6, 7, 8};
int D3[6] = {3, 4, 5, 6, 7, 8};
int D4[6] = {3, 4, 5, 6, 7, 8};
int D5[6] = {3, 4, 5, 6, 7, 8};
int D6[6] = {3, 4, 5, 6, 7, 1};

int ST1[1] = {6};

int ans[] = {1, 4, 5, 6, 7, 8};

int res = algo(D1, D2, D3, D4, D5, D6, ans, ST1[0]);
std::cout << "algo returned " << res << "\n";
}

我们做了一些性能假设:ans 的内容应该排序,否则我们应该构造它,我们假设 D1..D6 的内容会在调用 algo 时发生变化。因此我们不必为它构造一个集合(因为集合构造是 O(n) 无论如何如果 D1..D6 正在改变我们将不会获得任何东西)。但是,如果我们使用相同的 D1..D6 多次调用 algo 并且那是 ans 变化,我们应该做相反的事情并将 D1..D6 转换为一个更大的集合,我们保持可用。

如果我坚持使用 C,我可以按如下方式进行:

  • 将 D1..D6 中的所有数字复制到一个唯一数组中(对每一行使用 memcpy)
  • 对该数组的内容进行排序
  • 使用二分法搜索检查数字是否可用

由于这里的数据量真的很小,我们也可以尝试进行微优化。它可以在这里支付更好。不确定。

EDIT2:CUDA 支持的 C 子集有硬性限制。最严格的限制是我们不应该使用指向主存的指针。必须考虑到这一点。它解释了为什么当前代码不起作用。最简单的更改可能是依次为每个数组 D1..D6 调用它。为了保持简短并避免函数调用成本,我们可以使用宏或内联函数。我将发布一个提案。

关于c - 这个数组比较问题的最佳算法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2775774/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com