haskell - 如何从 Haskell 中的复杂或复合分布中采样？-6ren

haskell - 如何从 Haskell 中的复杂或复合分布中采样？

转载作者：行者123 更新时间：2023-12-02 16:05:55

25

4

我正在尝试为 Haskell 中假设的行星生成随机质量。我想通过采样双峰分布(理想情况下是两种正态分布的叠加:一种对应于小行星，一种对应于气态巨行星)来产生这些质量。我看过statistics package ，它提供了quantile函数，可以将均匀分布的Double转换为多个分布上的Double。但似乎不支持编写发行版。

这种特殊情况可以通过预先选择一个发行版或另一个发行版进行采样来解决，但我想使用单个发行版来完成此操作，特别是因为我稍后可能需要调整整体发行版。最终我可能会用天空调查的真实数据替换正态分布。

我正在考虑实现 rejection sampling我自己，它可以相当简单地处理任意分布，但似乎效率相当低，如果解决方案已经作为库存在，那么实现它肯定不是一个好主意。

是否有 Haskell 库支持从组合或明确指定的分布中采样？或者现有的 Haskell 拒绝抽样实现？或者，是否有两个正态分布之和的 CDF 的倒数的明确公式？

最佳答案

在简单混合发行版的情况下，您可以通过您首先提到的“黑客”获得高效的采样器:

This particular case could be hacked around by picking one distribution or the other to sample before-hand, but I'd like to do it with a single distribution, especially since I might need to tweak the overall distribution later.

这实际上是统计中非常普遍的吉布斯抽样的情况。它非常灵活，如果您知道所使用的混合物的数量，它可能很难被击败。从整个集合中选择一个单独的分布进行采样，然后从该条件分布中进行采样。冲洗并重复。

这是一个简单的、未优化的 Haskell 实现，用于混合高斯吉布斯采样器。这是非常基本的，但你明白了:

import System.Random
import Control.Monad.State

type ModeList = [(Double, Double)]                 -- A list of mean/stdev pairs, for each mode.

-- Generate a Gaussian (0, 1) variate.
boxMuller :: StdGen -> (Double, StdGen)
boxMuller gen = (sqrt (-2 * log u1) * cos (2 * pi * u2), gen'')
    where (u1, gen')  = randomR (0, 1) gen 
          (u2, gen'') = randomR (0, 1) gen'

sampler :: ModeList -> State StdGen Double
sampler modeInfo = do
    gen <- get
    let n           = length modeInfo
        (z0, g0)    = boxMuller gen
        (c,  g1)    = randomR (0, n - 1) g0        -- Sample from the components.
        (cmu, csig) = modeInfo !! c                
    put g1
    return $ cmu + csig * z0                       -- Sample from the conditional distribution.

下面是一个运行示例:从两个高斯的一维混合中采样 100 次。众数为 x = -3 和 x = 2.5，每个混合分量都有自己单独的方差。您可以在此处添加任意数量的模式。

main = do
let gen      = mkStdGen 42
    modeInfo = [(2.5, 1.0), (-3, 1.5)]
    samples     = (`evalState` gen) . replicateM 100 $ sampler modeInfo
print samples

这是这 100 个样本的平滑密度图(使用 R 和 ggplot2):

a mixture of gaussians

更通用的算法是拒绝或重要性采样器，在更复杂的分布的情况下，您可能需要手动滚动适当的 MCMC 例程。 Here是对蒙特卡洛和 MCMC 的很好的介绍。

关于haskell - 如何从 Haskell 中的复杂或复合分布中采样？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10827221/

25

4

0

文章推荐： kdb - 用 kdb+ Q 编程语言将随机数添加到列表中

文章推荐： javascript - MongoDB 通过 Javascript Value 声明键

文章推荐： python - 从 pandas DataFrame 中的日期时间列中提取月份

Java:复合
我正在实现一个显示容器级别的图表。根据填充水平，线条的颜色应该改变(例如，接近最大值时应该显示红色)。我不想计算线条的不同部分并手动设置它们的颜色，而是想定义一个颜色自动改变的带。我想用自定义 Com
复合/while 循环
#include int main(void) { int days, hours, mins; float a, b, c, total, temp, tempA, tempB; a
复合 IF 语句作用域
if()//first if { if()//second if statement; } else statement; 我知道 else 与第一个 if 匹配，但我的问题是为什么？我是
delphi - 复合 "with"语句中的名称解析如何工作？
以下代码中测试了 Ready 的哪个实例，为什么？ interface type TObject1 = class ... public property Ready: boole
css - 复合 CSS？
我刚刚花了相当多的时间来寻找像这个 plunk 中的差距.问题没那么简单。这是一个动态创建的页面，一些具有 margin-bottom 的组件恰好显示在 .main 的最后。在我指责 CSS 之前，
java - 复合、按钮和图标
我的程序应该在对话中创建圆形图标。我有三个按钮，每个按钮代表要制作的图标的颜色。因此，如果我点击不同的按钮 10 次，我的程序应该创建 10 个不同颜色的圆圈。这是我的代码，分为 2 个类: impo
c - 复合/字符串文字存储在内存中的什么位置？
我读过； A compound literal is a C99 feature that can be used to create an array with no name. Consider
复合 View 中的android双布局对象
当您创建一个复合 View 并为其扩充 xml 布局文件时，如下所示: public class CompundLayout extends LinearLayout{...} 这会像这样用根扩展一个
GWT uibinder 复合 Material
我正在创建一个带有标签和文本框的复合 uibinder 小部件。预期用途是: The text to be put in the box. 我找到了如何使用自定义 @UiConstruc
design-patterns - 复合 + 责任链示例
任何人都可以举一个结合使用设计模式组合和责任链的实际例子吗？谢谢最佳答案一个非常实际的例子是 GUI 设计，例如 Qt 框架。 QObject 可以是单个对象或多个对象的组合。 QObjects
validation - 复合 View 模型对象导致远程验证失败
我在这个项目中的一些表单中使用了复合 View 模型的模式。它工作得很好。在这种情况下，我有一个 VendorAddress View 模型。我在这个项目的几个地方使用了 Address(es)，所
sql - 复合 SQL 连接？
我正在尝试构建一个我认为需要多个 JOIN 的 SQL 查询，但我不知道语法。这是每个表(带有列名)的粗略示例。 T1( key ，名称) T2(键，fkeyT1) T3(键，fkeyT2) 我想从
swt - 禁用和灰显 SWT 复合
我有一个 Composite我希望能够以编程方式启用/禁用。 Control.setEnabled(boolean enabled)方法工作正常，但它没有提供任何小部件被禁用的视觉信息。我想做的是让
php:复合 if 语句(被忽略)
如果子域不是“mobile”并且文件名不是“design”或“photo”，我想回显某些内容，因此 echo if (not“mobile”且不是“design”)或(not“mobile”而不是“照
SQLITE3 复合 "Select"语句
我有一张有几列的 table 。第 1 列和第 2 列可以包含四个 alpha 值中的任何一个:set={A,B,C,D}。我想检查每列是否包含集合中的两个值之一。所以我想简化这个陈述: SELEC
localization - 复合 C1 表单渲染器本地化
我创建了一个全局数据类型，并在页面中使用表单渲染器让用户填写数据并提交到网站。默认的英语工作正常。现在，当我尝试支持第二种语言时，我遇到了问题。根据复合文档: 1.在 ~/Frontend/Comp
java - 复合 int 键和值
我需要将自定义对象作为值存储在字典中，例如具有两个复合整数键的 datastrukturer。 (复合 ID) 我尝试使用数组作为键，但两者都不起作用，因为我猜这只是指向该数组的指针，用作键如果我能
cakephp - 用两个(复合)外键关系链接两个表
版本:3.2.1 关系表B中的两列与表A中的两列相关联。表A-> hasMany->表B 表B->属于--表A B.a_id = A.a_id B.a_name = A.a_name 食谱在食谱
localization - 复合 C1 表单渲染器本地化
我创建了一个全局数据类型，并在页面中使用表单渲染器让用户填写数据并提交到网站。默认的英语工作正常。现在，当我尝试支持第二种语言时，我遇到了问题。根据复合文档: 1.在 ~/Frontend/Comp
具有静态文件扩展名的 Log4Net 复合 RollingFileAppender
当前版本的 Log4net 是否有办法创建具有复合滚动样式的 RollingFileAppender，其中滚动文件始终保留给定的扩展名(在我的情况下为 .log)？我想要的格式示例: MyLog.l

首页

博学

6Ren·AI

商城

haskell - 如何从 Haskell 中的复杂或复合分布中采样？