- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我目前正在编写一个程序,需要比较可变大小的 ArrayList 中的每个文件。现在,我这样做的方式是通过嵌套代码循环:
if(tempList.size()>1){
for(int i=0;i<=tempList.size()-1;i++)
//Nested loops. I should feel dirty?
for(int j=i+1;j<=tempList.size()-1;j++){
//*Gets sorted.
System.out.println(checkBytes(tempList.get(i), tempList.get(j)));
}
}
我读过一些关于嵌套循环必要性的不同意见,我想知道是否有人有更有效的替代方案。
乍看之下,每次比较都需要进行,无论哪种方式,因此性能应该相当稳定,但我相信有一种更简洁的方法可以做到这一点。有什么指点吗?
编辑::为了清楚起见,这只是函数的一部分。文件已经过比较并根据长度放入桶中 - 在遍历集合的映射并找到长度大于一个的桶后,它会运行它。所以 - 这些都是相同大小的文件。我也会在处理字节之前进行校验和比较,但现在我只是想清理循环。
此外,天哪,这个网站的响应速度很快。谢谢,伙计们。
EDIT2::抱歉,需要进一步说明:文件处理部分我已经掌握得很好,我认为 - 首先,我按长度比较和排序,然后按校验和,然后按字节 - 我遇到的问题是如何正确处理需要有效地比较 ArrayList 中的所有文件,假设它们都需要进行比较。如果嵌套循环就足够了,那很好,我只是想检查一下这是否是一种合适的方法,符合惯例。
最佳答案
一个好的优化是首先计算文件的所有哈希值,然后对列表进行一次循环。
这主要是因为无论如何您都必须检查列表中的每一对文件,但这意味着每对文件的复杂度仅为 O(1),而不是为您要检查的每个文件计算很多东西.
你可以这样做:
HashSet<YourFile> fileSet = new HashSet<YourFile>();
ArrayList<YourFile> files = new ArrayList<YourFile>();
class YourFile
{
int hashcode = -1;
public int hashCode()
{
// override it to provide an hashcode based on file contents
// you can also cache it to avoid recalculating anything
if (hashcode == -1)
hashcode = calculateIt();
return hashcode;
}
}
// fill up files
files.add(...);
// do comparisons
for (YourFile f : files)
{
if (fileSet.contains(f))
// f and fileSet.get(f) are equal: this is a tricky utilization of the hashCode() method so be careful about it!
else
{
fileSet.put(f);
// since there's not a file with same hashcode you just add this one
}
}
这实际上会放弃内部循环,因为当您使用 hashSet.contains
时,它会检查所有已添加的文件,但复杂度为 O(1)。
正如 doublep 所述,您必须注意性能,因为当您简单地检查字节时,一旦发现两个不同的字节就会停止,而计算哈希将需要检查整个文件。当您有很多文件或文件很小时,这会很有效。最好的办法是对这两种方法进行基准测试,看看是否存在显着差异。
关于java - 替代嵌套循环进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2702253/
我是 PHP 新手。我一直在脚本中使用 for 循环、while 循环、foreach 循环。我想知道 哪个性能更好? 选择循环的标准是什么? 当我们在另一个循环中循环时应该使用哪个? 我一直想知道要
我在高中的编程课上,我的作业是制作一个基本的小计和顶级计算器,但我在一家餐馆工作,所以制作一个只能让你在一种食物中读到。因此,我尝试让它能够接收多种食品并将它们添加到一个价格变量中。抱歉,如果某些代码
这是我正在学习的一本教科书。 var ingredients = ["eggs", "milk", "flour", "sugar", "baking soda", "baking powder",
我正在从字符串中提取数字并将其传递给函数。我想给它加 1,然后返回字符串,同时保留前导零。我可以使用 while 循环来完成此操作,但不能使用 for 循环。 for 循环只是跳过零。 var add
编辑:我已经在程序的输出中进行了编辑。 该程序要求估计给定值 mu。用户给出一个值 mu,同时还提供了四个不等于 1 的不同数字(称为 w、x、y、z)。然后,程序尝试使用 de Jaeger 公式找
我正在编写一个算法,该算法对一个整数数组从末尾到开头执行一个大循环,其中包含一个 if 条件。第一次条件为假时,循环可以终止。 因此,对于 for 循环,如果条件为假,它会继续迭代并进行简单的变量更改
现在我已经习惯了在内存非常有限的情况下进行编程,但我没有答案的一个问题是:哪个内存效率更高;- for(;;) 或 while() ?还是它们可以平等互换?如果有的话,还要对效率问题发表评论! 最佳答
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 8 年前。 我正在尝试创建一个小程序,我可以在其中读取该程序的单词。如果单词有 6
这个问题在这里已经有了答案: python : list index out of range error while iteratively popping elements (12 个答案) 关
我正在尝试向用户请求 4 到 10 之间的整数。如果他们回答超出该范围,它将进入循环。当用户第一次正确输入数字时,它不会中断并继续执行 else 语句。如果用户在 else 语句中正确输入数字,它将正
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我想要做的事情是使用循环创建一个数组,然后在另一个类中调用该数组,这不会做,也可能永远不会做。解决这个问题最好的方法是什么?我已经寻找了所有解决方案,但它们无法编译。感谢您的帮助。 import ja
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我正在模拟一家快餐店三个多小时。这三个小时分为 18 个间隔,每个间隔 600 秒。每个间隔都会输出有关这 600 秒内发生的情况的统计信息。 我原来的结构是这样的: int i; for (i=0;
这个问题已经有答案了: IE8 for...in enumerator (3 个回答) How do I check if an object has a specific property in J
哪个对性能更好?这可能与其他编程语言不一致,所以如果它们不同,或者如果你能用你对特定语言的知识回答我的问题,请解释。 我将使用 c++ 作为示例,但我想知道它在 java、c 或任何其他主流语言中的工
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我是 C 编程和编写代码的新手,以确定 M 测试用例的质因数分解。如果我一次只扫描一次,该功能本身就可以工作,但是当我尝试执行 M 次时却惨遭失败。 我不知道为什么 scanf() 循环有问题。 in
这个问题已经有答案了: JavaScript by reference vs. by value [duplicate] (4 个回答) 已关闭 3 年前。 我在使用 TSlint 时遇到问题,并且理
我尝试在下面的代码中添加 foreach 或 for 循环,以便为 Charts.js 创建多个数据集。这将允许我在此折线图上创建多条线。 我有一个 PHP 对象,我可以对其进行编码以稍后填充变量,但
我是一名优秀的程序员,十分优秀!