- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
考虑这个代码示例,根据 Akaike 准则从不同拟合高斯数量的数据中获得最佳拟合
MU1 = [1];
SIGMA1 = [2];
MU2 = [-3];
SIGMA2 = [1 ];
X = [mvnrnd(MU1,SIGMA1,1000);mvnrnd(MU2,SIGMA2,1000)];
AIC = zeros(1,4);
obj = cell(1,4);
options = statset('Display','final');
for k = 1:4
obj{k} = gmdistribution.fit(X,k,'Options',options);
AIC(k)= obj{k}.AIC;
end
[minAIC,numComponents] = min(AIC)
我想做同样的事情,但使用以直方图形式给出的数据(例如考虑数据 http://pastebin.com/embed_js.php?i=1mNRuEHZ )。
在这种情况下,在 matlab 中实现相同过程的最直接方法是什么?
最佳答案
如果我没看错,那么您的问题是在已经编译为直方图的数据(因此观测值的数量与观测值的实际值配对)和原始单个观测值之间进行转换。当然,在编译直方图时,你丢失了两件事:
订单。您不知道原始数据中的观察顺序是什么,这可能并不重要,前提是您的观察是独立的。此外,我获取 gmdistribution.fit() 的方式无论如何都不会考虑顺序。
决议。创建直方图时,您需要对数据进行分箱,这可以说会降低精度,因为无法从分箱中恢复观测值的精确值。
一旦您意识到这一点,您就可以根据直方图数据创建“观察向量”。比如说,X1 是您的直方图数据(Nx2 向量)。如果你这样做
invX = cell2mat(arrayfun(@(x,y) repmat(y,1,x), abs(int16(1000*X1(:, 2)))', X1(:, 1)', ...
'UniformOutput', false))';
您会得到一个包含单个观察值的向量,就像示例中的 X 一样。
请注意,您必须先将 bin 计数转换为整数。在这一步,因为给定数据的精度相当高,我不得不四舍五入,使我的机器能够进行计算。不过,最后的结果似乎还算合理。
另请注意,我使用了绝对值,在您的直方图数据中有些情况下您的数据实际上是负数,这对于直方图显然没有意义。
最后但同样重要的是,您必须将拟合过程的迭代次数更改为 1000。生成下图的最终代码如下所示
MU1 = [1];
SIGMA1 = [2];
MU2 = [-3];
SIGMA2 = [1 ];
X = [mvnrnd(MU1,SIGMA1,1000);mvnrnd(MU2,SIGMA2,1000)];
X = X1(:, 2);
invX = cell2mat(arrayfun(@(x,y) repmat(y,1,x), abs(int16(1000*X1(:, 2)))', X1(:, 1)', ...
'UniformOutput', false))'; %'
X = invX;
AIC = zeros(1,4);
obj = cell(1,4);
options = statset('Display','final', 'MaxIter', 1000);
for k = 1:4
obj{k} = gmdistribution.fit(X,k,'Options',options);
AIC(k)= obj{k}.AIC;
end
[minAIC,numComponents] = min(AIC);
hold on;
plot(linspace(-1, 2, length(X1(:, 2))), abs(X1(:, 2)), 'LineWidth', 2)
plot(x, pd/max(pd)*double(max(abs(X1(:, 2)))), 'LineWidth', 5);
h = legend('Original data', 'PDF');
set(h,'FontSize',32);
关于Matlab:直方图数据与许多高斯和 AIC 评估的拟合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32499275/
我尝试手动编写 AIC 的公式。我想将它与 scikit learn 结合使用。为了测试我的编码是否正确,我比较了给定相同数据集的 statsmodels 的 AIC 值。但如果我比较模型 M1 和模
在跨数据框的一个响应变量和多个解释变量之间应用模型后,我想按 AIC 分数对每个模型进行排名。我遇到了一个非常相似的问题,它正是我想做的。 Using lapply on a list of mode
假设我有以下数据: array([[0.88574245, 0.3749999 , 0.39727183, 0.50534724], [0.22034441, 0.81442653,
我正在尝试评估 R 中多个回归的模型拟合,但我遇到了一个我现在遇到过多次的问题:我的泊松回归的对数似然是无限的。 我使用的是非整数因变量(注意:我知道我在这方面做了什么),我想知道这是否是问题所在。但
我对 R 和 Python 相当陌生。我喜欢使用 Akaike 信息准则执行多元回归来选择变量并评估我的准则。 我编写了一些代码来使用 F 统计 P 值选择变量。该数据集包含房价信息 我计划将变量(即
考虑这个代码示例,根据 Akaike 准则从不同拟合高斯数量的数据中获得最佳拟合 MU1 = [1]; SIGMA1 = [2]; MU2 = [-3]; SIGMA2 = [1 ]; X = [mv
这是来自 ?lm 的一个非常简单的 lm 模型 ctl 46.17468 (LL1 -20.08824 (df=3) 从第一性原理重构: n -20.08828 这有点不对劲,还没发现毛病。 参
data <-c(88, 84, 85, 85, 84, 85, 83, 85, 88, 89, 91, 99, 104, 112, 126, 138, 146,151, 150, 148, 14
我正在尝试从具有不同的 ARIMA 估计中提取 AIC 和 BIC p & q 的组合 (p=0,1,2,3 并且 q=0,1.2,3)。我曾尝试使用以下代码,但未成功。 code: storage1
如何从 lm_robust 对象(包 estimatr)获取 AIC?我使用 lm_robust 是因为我想使用稳健的估计器来计算 SE。与 lm 函数不同,当您运行汇总函数并在 lm_robust
我有: from scipy import stats data = stats.gamma.rvs(2, loc=1.5, scale=2, size=100000) 所以我做了一个合适的 fitt
据我所知,Python中没有AIC包。因此,我尝试手动计算它以找到我的数据集中的最佳聚类数(我使用 K-means 进行聚类) 我遵循 Wiki 上的等式: AIC = 2k - 2ln(最大似然)
我想计算线性模型的 AIC 以比较它们的复杂性。我是这样做的: regr = linear_model.LinearRegression() regr.fit(X, y) aic_intercept_
我使用 MICE 包估算了数据。现在,我想展示基于汇总数据的 GLM 结果。 这就是我得出数据的方式: data.imputed <- mice(data, m=5, maxit = 50, meth
所以这是我的数据头, thickness grains resistivity 1 25.1 14.9 0.0270 2 368.4 58.1 0.0
我一直在尝试使用 biglm 在大型数据集(约 60,000,000 行)上运行线性回归。我想使用 AIC 进行模型选择。但是我发现在较小的数据集上使用 biglm 时,biglm 返回的 AIC 变
我已经用谷歌搜索了这个并找不到解决方案。 R 似乎在 AIC/BIC 计算方面存在问题。它会产生错误的结果。一个简单的例子如下所示: link = 'https://gist.githubuserco
我想知道是否可以从 GLMNet 获取 AIC 和 BIC。我发现 glmnet.cr 似乎能够做到这一点,但我的 react 是时间,而不是序数。我可以根据可能性自己计算它,但 glmnet 也不会
指定相同 AR(或 MA)模型由 R 中的 forecast 包中的函数 arima() 进行估计的不同方法不同的 BIC(贝叶斯信息准则)值。 为什么会发生这种情况? 考虑两种模型: (1) AR(
我尝试使用 R 重现一些 SAS 输出。我想重现的方法是: 使用混合模型对因子时间进行重复测量的两种方差分析(协方差矩阵 = CS,估计方法 = REML) 一切看起来都很好,除了 AIC .....
我是一名优秀的程序员,十分优秀!