python - 将对数正态分布拟合到已经装箱的数据 python-6ren

python - 将对数正态分布拟合到已经装箱的数据 python

转载作者：太空宇宙更新时间：2023-11-04 02:50:07

28

4

我想对我已经装箱的数据进行对数正态拟合。条形图如下所示:

不幸的是，当我尝试使用标准 lognorm.pdf() 时，拟合分布的形状非常不同。我想这是因为我的数据已经装箱了。这是代码:

times, data, bin_points = ReadHistogramFile(filename)

xmin = 200
xmax = 800
x = np.linspace(xmin, xmax, 1000)
shape, loc, scale = stats.lognorm.fit(data, floc=0)
pdf = stats.lognorm.pdf(x, shape, loc=loc, scale=scale)

area=data.sum()
plt.bar(bars, data, width=10, color='b')
plt.plot(x*area, pdf, 'k' )

这是拟合分布的样子: 显然，缩放也有问题。不过我不太关心这个。我的主要问题是分布的形状。这可能与:this question 重复，但我找不到正确的解决方案。我试过了，但仍然得到与执行上述操作时非常相似的形状。感谢您的帮助!

更新:通过使用 curve_fit() 我能够得到一些适合。但我还不满意。我想要原始垃圾箱而不是统一垃圾箱。我也不确定，到底发生了什么，如果没有更好的选择。这是代码:

def normalize_integral(data, bin_size):
normalized_data = np.zeros(size(data))
print bin_size
sum = data.sum()
integral = bin_size*sum
for i in range(0, size(data)-1):
    normalized_data[i] = data[i]/integral

print 'integral:', normalized_data.sum()*bin_size
return normalized_data



def pdf(x, mu, sigma):
"""pdf of lognormal distribution"""

return (np.exp(-(np.log(x) - mu)**2 / (2 * sigma**2)) / (x * sigma * np.sqrt(2 * np.pi)))


bin_points=np.linspace(280.5, 1099.55994, len(bin_points))
data=[9.78200000e+03 1.15120000e+04 1.18000000e+04 1.79620000e+04 2.76980000e+04   2.78260000e+04   3.35460000e+04   3.24260000e+04 3.16500000e+04   3.30820000e+04   4.84560000e+04   5.86500000e+04 6.34220000e+04   5.11880000e+04   5.13180000e+04   4.74320000e+04 4.35420000e+04   4.13400000e+04   3.60880000e+04   2.96900000e+04 2.66640000e+04   2.58720000e+04   2.57560000e+04   2.20960000e+04 1.46880000e+04   9.97200000e+03   5.74200000e+03   3.52000000e+03 2.74600000e+03   2.61800000e+03   1.50000000e+03   7.96000000e+02 5.40000000e+02   2.98000000e+02   2.90000000e+02   2.22000000e+02 2.26000000e+02   1.88000000e+02   1.20000000e+02   5.00000000e+01 5.40000000e+01   5.80000000e+01   5.20000000e+01   2.00000000e+01 2.80000000e+01   6.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00 0.00000000e+00   0.00000000e+00]
normalized_data_unitybins = normalize_integral(data,1)


plt.figure(figsize=(9,4))
ax1=plt.subplot(121)
ax2=plt.subplot(122)
ax2.bar(unity_bins, normalized_data_unitybins, width=1, color='b')
fitParams, fitCov = curve_fit(pdf, unity_bins, normalized_data_unitybins, p0=[1,1],maxfev = 1000000)
fitData=pdf(unity_bins, *fitParams)
ax2.plot(unity_bins, fitData,'g-')

ax1.bar(bin_points, normalized_data_unitybins, width=10, color='b')
fitParams, fitCov = curve_fit(pdf, bin_points, normalized_data_unitybins, p0=[1,1],maxfev = 1000000)
fitData=pdf(bin_points, *fitParams)
ax1.plot(bin_points, fitData,'g-')

最佳答案

如您所述，您不能对分箱数据使用 lognorm.fit。所以你需要做的就是从直方图中恢复原始数据。显然这不是“无损”的，bins 越多越好。

带有一些生成数据的示例代码:

import numpy as np
import scipy.stats as stats
import matplotlib.pylab as plt


# generate some data
ln = stats.lognorm(0.4,scale=100)
data = ln.rvs(size=2000)

counts, bins, _ = plt.hist(data, bins=50)
# note that the len of bins is 51, since it contains upper and lower limit of every bin

# restore data from histogram: counts multiplied bin centers
restored = [[d]*int(counts[n]) for n,d in enumerate((bins[1:]+bins[:-1])/2)]
# flatten the result
restored = [item for sublist in restored for item in sublist]

print stats.lognorm.fit(restored, floc=0)

dist = stats.lognorm(*stats.lognorm.fit(restored, floc=0))
x = np.arange(1,400)
y = dist.pdf(x)

# the pdf is normalized, so we need to scale it to match the histogram
y = y/y.max()
y = y*counts.max()

plt.plot(x,y,'r',linewidth=2)
plt.show()

关于python - 将对数正态分布拟合到已经装箱的数据 python，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44137933/

28

4

0

文章推荐： javascript - 获取类属性内的所有类名

文章推荐： javascript - 如何检查对象中的 hasOwnProperty 链

文章推荐： node.js - Node Express Mocha 测试 : TypeError: chai. 请求不是函数

c# - 定时器不会死(已经!)
一段时间以来，我一直在做这个反复出现的噩梦(阅读 - 我的应用程序中的错误)。出于某种原因，某个计时器在我停止后继续发送“Elapsed”事件，即使在事件本身计时器“承认”已被禁用!检查一下: /
git:我如何找到两个分支的共同祖先......已经 merge
为了找到 2 个 git 分支的共同祖先，需要做的是: git merge-base branch another_branch 好的。但是……如果两个分支都已经 merge 了怎么办？当我在这种情况
javascript - Javascript 已经 react 了吗？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 1年前关闭。 Improve this
iphone - iOS 相机捕捉 View 已经？
我想要一个相机 View ，可以将图像捕获到本地文件或让用户从本地照片库中选择图像。我想也许有人为此编写了很好的库/代码。也许我可以利用它。已经有好的了吗？谢谢。我只是避免重新发明轮子:) 最佳答案
git rebase 已经 merge 了分支？
我从 master 分支创建了一个功能分支。之后有来自功能分支的提交 [F1]。 [F1] -- Feature Branch / [M1]-[M2
c# - Linux 上的 WPF(已经)可能吗？
我喜欢使用 .NET 进行编程，尤其是 C# 3.0、.NET 3.5 和 WPF。但我特别喜欢的是 Mono .NET 确实与平台无关。现在我听说了 Mono 中的 Olive 项目。我找不到某种
git - 如何调和分离的头和起源/主人？已经 checkout 旧哈希
介绍和搜索所以我认为我犯了一个严重的错误，我很担心。我已经分析了独立负责人的论坛，我已经接近找到答案，但场景太具体，不适用于我所在的位置。如果您找到可以回答我的问题的特定主题，请链接我。例如:Ho
git - 如何重新 merge 已经 merge 的分支？
我有一个类似于下图的提交图。标记为 * 的提交表示大量提交。 A* | B--------- | | C* D* master 和 cor
c# - Linux 上的 WPF(已经)可能吗？
我喜欢使用 .NET 进行编程，尤其是 C# 3.0、.NET 3.5 和 WPF。但我特别喜欢的是 Mono .NET 确实与平台无关。现在我听说了 Mono 中的 Olive 项目。我找不到某种
asp.net - 已经 Html 编码的 Html 编码值
我们最近接手了一个 .NET 项目，在查看 db 后，我们在某些列中有以下内容: 1)某些列具有诸如" & etc etc 2) 有些有标签和其他非 html 编码的标签这些数据
flutter - 未处理的异常:不良状态: future 已经 flutter 朔迷离
你好，当我导航到应用程序中的另一个页面时出现此错误我不知道为什么这个错误出现 #0 _AsyncCompleter.complete (dart:async/future_impl.da
已经 CRC32 处理的数据的 CRC32 附加了 CRC 数据
我使用以下 C 算法计算数据的 CRC32: #define CRC32_POLYNOM_REVERSED 0xEDB88320 uint32 calcCrc32(uint8* buffer, u
python - 是否有(已经)一种方法来比较 2 个模型实例，一个字段一个字段，看它们是否相等？
我试图在我的一个测试中断言模型中的字段没有改变。我知道从哲学上这是不正确的，但由于我控制了我需要知道的所有变量，所以我只想检查我的数据库条目是否没有改变。我愿意接受一个解决方案，该解决方案可以将其转
git - 你的分支和 'origin/master' 已经 fork ，所有冲突都已修复但你仍在 merge
我是 GitHub 的新手。并通过 Eclipse 使用它我们是两个人在开发一个应用程序。当我在 Git shell 中检查 git status 时，我得到以下状态。 On branch maste
c++ - 已经 "EOF"ed ifstream 上的 peek() 是否继续返回 EOF？
简单代码: std::ifstream file("file.txt"); std::string line; while(getline(file,line)) ; //exhaust file
android - Gradle DSL 方法未找到 : 'compile()' - Dependencies are in Module level build. gradle 已经
是的，我又找不到这个 Gradle DSL 方法:'compile()' 问题。我检查了我有: buildscript { repositories { jcenter()
jquery - 如何使用 jQuery 覆盖(已经)定义的带有嵌套 anchor 标记的 DIV 类的 CSS 样式？
HTML: articles CSS: #main_menu { float: left; padding-top: 10px; vertical-align: m

首页

博学

6Ren·AI

商城

python - 将对数正态分布拟合到已经装箱的数据 python