math - log-sum-exp 技巧为什么不递归-6ren

math - log-sum-exp 技巧为什么不递归

转载作者：行者123 更新时间：2023-12-02 05:30:01

26

4

我一直在研究 log-sum-exp 问题。我有一个以对数形式存储的数字列表，我想将其求和并以对数形式存储。

简单的算法是

def naive(listOfLogs):
    return math.log10(sum(10**x for x in listOfLogs))

许多网站，包括: logsumexp implementation in C?和 http://machineintelligence.tumblr.com/post/4998477107/推荐使用

def recommend(listOfLogs):
    maxLog = max(listOfLogs)
    return maxLog + math.log10(sum(10**(x-maxLog) for x in listOfLogs))

又名

def recommend(listOfLogs):
    maxLog = max(listOfLogs)
    return maxLog + naive((x-maxLog) for x in listOfLogs)

我不明白的是，如果推荐的算法更好，为什么我们要递归地调用它？这会带来更多好处吗？

def recursive(listOfLogs):
    maxLog = max(listOfLogs)
    return maxLog + recursive((x-maxLog) for x in listOfLogs)

当我问是否还有其他技巧可以使该计算在数值上更加稳定时？

最佳答案

其他人的一些背景:当您直接计算以下类型的表达式时

ln( exp(x_1) + exp(x_2) + ... )

您可能会遇到两种问题:

exp(x_i)可能会溢出( x_i 太大)，导致数字无法相加
exp(x_i)可能会下溢( x_i 太小)，导致一堆零

如果所有的值都很大，或者都很小，我们可以除以一些 exp(const)并添加const到 ln 的外面以获得相同的值。因此，如果我们可以选择正确的 const ，我们可以将值移动到某个范围以防止上溢/下溢。

OP的问题是，我们为什么选择max(x_i)对于这个 const 而不是任何其他值？为什么我们不递归地进行此计算，从每个子集中选取最大值并重复计算对数？

答案:因为这并不重要。

原因是？比方说x_1 = 10大，并且x_2 = -10是小。 (这些数字甚至不是很大，对吧？)表达式

ln( exp(10) + exp(-10) )

会给你一个非常接近10的值。如果你不相信我，那就去试试吧。事实上，一般来说，ln( exp(x_1) + exp(x_2) + ... )将非常接近 max(x_i)如果有一些特定的x_i比其他所有的都大得多。 (顺便说一句，这种渐近函数形式实际上可以让您从数学上从一组数字中选择最大值。)

因此，我们选择最大值而不是任何其他值的原因是因为较小的值几乎不会影响结果。如果它们下溢，它们就太小而无法影响总和，因为它将由最大数和任何接近它的数主导。在计算方面，小数字的贡献将小于 ulp计算 ln 后。因此，如果较小值无论如何都会在最终结果中丢失，则没有理由浪费时间递归计算较小值的表达式。

如果你想在实现这个问题上非常挑剔，你可以除以 exp(max(x_i) - some_constant)左右将结果值“居中”在 1 附近，以避免溢出和下溢，这可能会给结果带来一些额外的精度。但避免上溢比避免下溢更重要，因为前者决定结果，而后者则不决定结果，所以这样做要简单得多。

关于math - log-sum-exp 技巧为什么不递归，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15275747/

26

4

0

文章推荐： java - 可以计算 2 个区间之间的数字的最大平方根次数

文章推荐： flash - cef如何支持H.264和flash？

jquery - 谷歌新闻，左导航 CSS 技巧？或 jQuery 技巧
我是新手。查看 Google 新闻...上下滚动页面时请注意左侧导航栏。看看它是如何滚动一点，然后在它消失之前粘在页面顶部的？关于如何做到这一点有什么想法吗？ jQuery 和 CSS 可以复制吗
改进性能和样式的24个ASP 技巧
技巧 1：在 Web 服务器上缓存常用数据技巧 2：在 Application 或 Session 对象中缓存常用数据技巧 3：在 Web 服务器磁盘上缓存数据和 HTML 技巧 4：避免
此任务的 Excel 技巧
我在 excel 中有一个电子表格，其中包含以下行: COLUMN Value1.Value2.Value3 Value4.Value5.Value6 Value7.Value8.Val
获取规则依赖项的 Makefile 技巧
GNU Makefile 中是否有任何技巧来获取规则的所有依赖项？例子: rule1: dep1_1 dep1_2 dep1_3 rule2: dep2_1 dep2_2 rule1 dump_
debugging - 追踪单点触控程序泄漏的技巧/技巧？
人们使用什么来追踪内存泄漏？我已经通过代码检查设法解决了一些问题，但我不知道下一步该做什么/当我的程序变大时我将如何管理问题。我知道我在泄漏什么类型的对象，但我不知道是什么让它保持活力。在 Wind
C#技巧——通过字符串获取常量值
有什么好的方法可以将“xlSum”、“xlAverage”和“xlCount”等字符串转换为它们在 Microsoft.Office.Interop.Excel.XlConsolidationFunc
Javascript 地址栏黑客/技巧
我们都见过这个: javascript:document.body.contentEditable='true'; document.designMode='on';无效 0 但我的问题是，这实际上是
类插件架构的 Java 技巧
我的应用程序将输出一个图形，其布局由用户定义。自定义布局类应该实现我定义的接口(interface)。我应该怎么做？有一个特殊的文件夹，我可以在其中查找布局类？用户是否将类名作为参数传递给应用？如有
Javascript DOM 技巧
我在弄清楚如何在 Javascript 中自引用表行时遇到了一些麻烦。这是简化的代码: $( "#listitems tbody" ).append( "" + "" + id.va
css 技巧，元素后面的行
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this q
避免指针比较的 C++ 技巧
我正在将代码库从一种编程风格转移到另一种编程风格。我们有一个名为 Operand 的类型，定义如下: class Operand {...}; 然后我们有 class OperandFactory
显示缩略图时避免额外类的 CSS 技巧
我使用以下缩略图类在我的内容包装器中显示 4x3 缩略图: .thumbnail { float:left; width:300px; height:200px; ma
algorithm - 如何识别相似的声音 - 技巧
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
c++ - constexpr 技巧
我认为这是不可能的，但我想在放弃之前问问你。我想要类似 constexpr 增量的东西。 #include constexpr int inc() { static int inc = 0;
新手 C++ 技巧
是否有任何适合 C++ 新手的技术和描述的好列表。我在想一个描述 RAII、RVO、左值的列表……这适用于目前不了解这些技术或来自不适用这些技术的其他语言的新手。最好是短小精悍的:-) 最佳答案是
在字符串中查找前导零的 Python 技巧
我有一个二进制字符串 '01110000'，我想在不编写 forloop 的情况下返回前面的前导零数。有谁知道如何做到这一点？如果字符串立即以“1”开头，最好也返回 0 最佳答案如果您真的确定它是一
内存优化的 Python 技巧
我需要优化我的应用程序的 RAM 使用率。请省去那些告诉我在编写 Python 代码时不应该关心内存的讲座。我有内存问题，因为我使用非常大的默认字典(是的，我也想快点)。我目前的内存消耗是 350M
CSS 黑客(技巧)
有时，当我看到一个我喜欢的网站或来自受人尊敬的人的网站时，我会查看源代码并尝试理解它们(就像我们所有人一样)。关于 Jeremy Keiths他使用以下代码的网站: [role="navigatio
7个管理家目录的 Git 技巧
这是我怎样设置 Git 来管理我的家目录的方法。我有好几台电脑。一台笔记本电脑用于工作，一台工作站放在家里，一台树莓派（或四台），一台 Pocket CHIP，一台运行
15、HBase shell 技巧
shell 技巧表变量 HBase 0.95 版本增加了为表提供 jruby 风格的面向对象引用的 shell 命令。以前，作用于表的所有 shell 命令都具有程序风格，该风格始终将表的名称作

首页

博学

6Ren·AI

商城

math - log-sum-exp 技巧为什么不递归