- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在研究 log-sum-exp 问题。我有一个以对数形式存储的数字列表,我想将其求和并以对数形式存储。
简单的算法是
def naive(listOfLogs):
return math.log10(sum(10**x for x in listOfLogs))
许多网站,包括: logsumexp implementation in C?和 http://machineintelligence.tumblr.com/post/4998477107/推荐使用
def recommend(listOfLogs):
maxLog = max(listOfLogs)
return maxLog + math.log10(sum(10**(x-maxLog) for x in listOfLogs))
又名
def recommend(listOfLogs):
maxLog = max(listOfLogs)
return maxLog + naive((x-maxLog) for x in listOfLogs)
我不明白的是,如果推荐的算法更好,为什么我们要递归地调用它?这会带来更多好处吗?
def recursive(listOfLogs):
maxLog = max(listOfLogs)
return maxLog + recursive((x-maxLog) for x in listOfLogs)
当我问是否还有其他技巧可以使该计算在数值上更加稳定时?
最佳答案
其他人的一些背景:当您直接计算以下类型的表达式时
ln( exp(x_1) + exp(x_2) + ... )
您可能会遇到两种问题:
exp(x_i)
可能会溢出( x_i
太大),导致数字无法相加exp(x_i)
可能会下溢( x_i
太小),导致一堆零如果所有的值都很大,或者都很小,我们可以除以一些 exp(const)
并添加const
到 ln
的外面以获得相同的值。因此,如果我们可以选择正确的 const
,我们可以将值移动到某个范围以防止上溢/下溢。
OP的问题是,我们为什么选择max(x_i)
对于这个 const 而不是任何其他值?为什么我们不递归地进行此计算,从每个子集中选取最大值并重复计算对数?
答案:因为这并不重要。
原因是?比方说x_1 = 10
大,并且x_2 = -10
是小。 (这些数字甚至不是很大,对吧?)表达式
ln( exp(10) + exp(-10) )
会给你一个非常接近10的值。如果你不相信我,那就去试试吧。事实上,一般来说,ln( exp(x_1) + exp(x_2) + ... )
将非常接近 max(x_i)
如果有一些特定的x_i
比其他所有的都大得多。 (顺便说一句,这种渐近函数形式实际上可以让您从数学上从一组数字中选择最大值。)
因此,我们选择最大值而不是任何其他值的原因是因为较小的值几乎不会影响结果。如果它们下溢,它们就太小而无法影响总和,因为它将由最大数和任何接近它的数主导。在计算方面,小数字的贡献将小于 ulp计算 ln
后。因此,如果较小值无论如何都会在最终结果中丢失,则没有理由浪费时间递归计算较小值的表达式。
如果你想在实现这个问题上非常挑剔,你可以除以 exp(max(x_i) - some_constant)
左右将结果值“居中”在 1 附近,以避免溢出和下溢,这可能会给结果带来一些额外的精度。但避免上溢比避免下溢更重要,因为前者决定结果,而后者则不决定结果,所以这样做要简单得多。
关于math - log-sum-exp 技巧为什么不递归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15275747/
我是新手。查看 Google 新闻...上下滚动页面时请注意左侧导航栏。 看看它是如何滚动一点,然后在它消失之前粘在页面顶部的? 关于如何做到这一点有什么想法吗? jQuery 和 CSS 可以复制吗
技巧 1:在 Web 服务器上缓存常用数据 技巧 2:在 Application 或 Session 对象中缓存常用数据 技巧 3:在 Web 服务器磁盘上缓存数据和 HTML 技巧 4:避免
我在 excel 中有一个电子表格,其中包含以下行: COLUMN Value1.Value2.Value3 Value4.Value5.Value6 Value7.Value8.Val
GNU Makefile 中是否有任何技巧来获取规则的所有依赖项? 例子: rule1: dep1_1 dep1_2 dep1_3 rule2: dep2_1 dep2_2 rule1 dump_
人们使用什么来追踪内存泄漏?我已经通过代码检查设法解决了一些问题,但我不知道下一步该做什么/当我的程序变大时我将如何管理问题。我知道我在泄漏什么类型的对象,但我不知道是什么让它保持活力。 在 Wind
有什么好的方法可以将“xlSum”、“xlAverage”和“xlCount”等字符串转换为它们在 Microsoft.Office.Interop.Excel.XlConsolidationFunc
我们都见过这个: javascript:document.body.contentEditable='true'; document.designMode='on';无效 0 但我的问题是,这实际上是
我的应用程序将输出一个图形,其布局由用户定义。自定义布局类应该实现我定义的接口(interface)。我应该怎么做?有一个特殊的文件夹,我可以在其中查找布局类?用户是否将类名作为参数传递给应用? 如有
我在弄清楚如何在 Javascript 中自引用表行时遇到了一些麻烦。 这是简化的代码: $( "#listitems tbody" ).append( "" + "" + id.va
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this q
我正在将代码库从一种编程风格转移到另一种编程风格。 我们有一个名为 Operand 的类型,定义如下: class Operand {...}; 然后我们有 class OperandFactory
我使用以下缩略图类在我的内容包装器中显示 4x3 缩略图: .thumbnail { float:left; width:300px; height:200px; ma
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我认为这是不可能的,但我想在放弃之前问问你。 我想要类似 constexpr 增量的东西。 #include constexpr int inc() { static int inc = 0;
是否有任何适合 C++ 新手的技术和描述的好列表。我在想一个描述 RAII、RVO、左值的列表……这适用于目前不了解这些技术或来自不适用这些技术的其他语言的新手。 最好是短小精悍的:-) 最佳答案 是
我有一个二进制字符串 '01110000',我想在不编写 forloop 的情况下返回前面的前导零数。有谁知道如何做到这一点?如果字符串立即以“1”开头,最好也返回 0 最佳答案 如果您真的确定它是一
我需要优化我的应用程序的 RAM 使用率。 请省去那些告诉我在编写 Python 代码时不应该关心内存的讲座。我有内存问题,因为我使用非常大的默认字典(是的,我也想快点)。我目前的内存消耗是 350M
有时,当我看到一个我喜欢的网站或来自受人尊敬的人的网站时,我会查看源代码并尝试理解它们(就像我们所有人一样)。 关于 Jeremy Keiths他使用以下代码的网站: [role="navigatio
这是我怎样设置 Git 来管理我的家目录的方法。 我有好几台电脑。一台笔记本电脑用于工作,一台工作站放在家里,一台树莓派(或四台),一台 Pocket CHIP,一台 运行
shell 技巧 表变量 HBase 0.95 版本增加了为表提供 jruby 风格的面向对象引用的 shell 命令。以前,作用于表的所有 shell 命令都具有程序风格,该风格始终将表的名称作
我是一名优秀的程序员,十分优秀!