- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
让矩阵 A
说 A = magic(100);
。我见过两种计算矩阵 A
的所有元素之和的方法。
sumOfA = sum(sum(A));
或者
sumOfA = sum(A(:));
其中一个比另一个更快(或更好地练习)吗?如果有的话是哪一个?或者它们都一样快?
最佳答案
对于性能和浮点精度哪个更重要,您似乎无法下定决心。
如果浮点精度是最重要的精度,那么您将分离正元素和负元素,对每个部分进行排序。然后按绝对值递增的顺序求和。是的,我知道,这比任何人都多,而且可能会浪费时间。
相反,请使用足够的精度,这样所犯的任何错误都将无关紧要。在测试等方面使用良好的数值实践,这样就不会产生问题。
就时间而言,对于一个 NxM 数组,
sum(A(:)) 将需要 N*M-1 次加法。
sum(sum(A)) 将需要 (N-1)*M + M-1 = N*M-1 次加法。
这两种方法都需要相同数量的添加,因此对于大型数组,即使解释器不够聪明,无法识别它们都是相同的操作,谁在乎呢?
这根本不是问题。不要小题大做,担心这个问题。
编辑:作为对 Amro 关于一种方法相对于另一种方法的错误的评论的回应,您几乎无法控制。添加将以不同的顺序完成,但无法保证哪个顺序更好。
A = randn(1000);
format long g
这两个解决方案非常接近。事实上,与 eps 相比,差别不大。
sum(A(:))
ans =
945.760668102446
sum(sum(A))
ans =
945.760668102449
sum(sum(A)) - sum(A(:))
ans =
2.72848410531878e-12
eps(sum(A(:)))
ans =
1.13686837721616e-13
假设您选择了我提到的分离和排序技巧。请注意负数部分和正数部分足够大,以至于精度会有所损失。
sum(sort(A(A<0),'descend'))
ans =
-398276.24754782
sum(sort(A(A<0),'descend')) + sum(sort(A(A>=0),'ascend'))
ans =
945.7606681037
因此,无论如何,您确实需要将这些片段累积到更高精度的数组中。我们可以试试这个:
[~,tags] = sort(abs(A(:)));
sum(A(tags))
ans =
945.760668102446
即使在这些测试中也会出现一个有趣的问题。因为测试是在随机(正常)阵列上完成的,所以会有问题吗?本质上,我们可以将 sum(A(:)) 视为随机游走,醉汉游走。但是考虑总和(总和(A))。 sum(A) 的每个元素(即内部和)本身就是 1000 个正态偏差的总和。看看其中的几个:
sum(A)
ans =
Columns 1 through 6
-32.6319600960983 36.8984589766173 38.2749084367497 27.3297721091922 30.5600109446534 -59.039228262402
Columns 7 through 12
3.82231962760523 4.11017616179294 -68.1497901792032 35.4196443983385 7.05786623564426 -27.1215387236418
Columns 13 through 18
当我们将它们相加时,会有精度损失。因此,作为 sum(A(:)) 的操作可能会稍微准确一些。是这样吗?如果我们使用更高的精度进行累加呢?所以首先,我将使用 double 对列求和,然后转换为 25 位小数精度,然后对行求和。 (我在这里只显示了 20 位数字,留下 5 位数字作为保护数字隐藏。)
sum(hpf(sum(A)))
ans =
945.76066810244807408
或者,直接转换为 25 位精度,然后对结果求和。
sum(hpf(A(:))
945.76066810244749807
所以 double 的两种形式在这里都同样错误,方向相反。最后,这一切都没有实际意义,因为与简单的变体 sum(A(:)) 或 sum(sum(A)) 相比,我展示的任何替代方案都耗时更多。只需选择其中之一,不用担心。
关于performance - 在matlab中对矩阵元素求和的有效(最快)方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11279549/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!