python - 如何规范scikit学习的kde？-6ren

python - 如何规范scikit学习的kde？

转载作者：行者123 更新时间：2023-12-03 23:10:59

24

4

假设我有一个形状为 (100000,1) 的数组，表示在 0 和 1 之间均匀分布的变量 X 的样本。
我想近似这个变量的概率密度，我使用 Scikit-Learn KernelDensity 来做到这一点。

问题是我只得到一个未标准化的结果。概率密度的积分总和不为 1。我应该怎么做才能自动归一化？难道我做错了什么？

def kde_sklearn(data, grid, **kwargs):
    """
    Kernel Density Estimation with Scikit-learn

    Parameters
    ----------
    data : numpy.array
        Data points used to compute a density estimator. It
        has `n x p` dimensions, representing n points and p
        variables.
    grid : numpy.array
        Data points at which the desity will be estimated. It
        has `m x p` dimensions, representing m points and p
        variables.

    Returns
    -------
    out : numpy.array
        Density estimate. Has `m x 1` dimensions
    """
    kde_skl = KernelDensity(**kwargs)
    kde_skl.fit(data)
    # score_samples() returns the log-likelihood of the samples
    log_pdf = kde_skl.score_samples(grid)
    return np.exp(log_pdf) 

X = np.random.uniform(0,1,1000).reshape(-1,1)
X1 = np.linspace(0,1,100)[:,np.newaxis]

kde_sklearn(X,X1,kernel='tophat')

Out[43]: 
array([0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,
       0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5])

我预计向量为 1，因为积分应为 1。

最佳答案

问题不在于规范化，正如我可以从一个例子中展示的那样。假设我运行以下代码，使 KDE 适合来自标准正态分布的样本:

import numpy as np
import sklearn.neighbors as sn

# Sample from a standard normal distribution
XX = np.random.randn(1000).reshape(-1, 1)

# Fit a KDE
kde_sklg = sn.KernelDensity()
kde_sklg.fit(XX)

# Get estimated densities
XX1 = np.linspace(-4.0, 4.0, 100)[:, np.newaxis]
gdens = np.exp(kde_sklg.score_samples(XX1))

然后我可以使用梯形规则估计 PDF 下的面积，如下所示:

my_area = 0.0
for i in range(1,gdens.shape[0]):
    my_area += 0.5*(gdens[i] + gdens[i-1])*(XX1[i,0] - XX1[i-1,0])

我得到的估计面积 ( my_area ) 约为 0.996，非常接近 1。

问题是你的 KDE 没有处理你的统一 PDF 中发生在 0 和 1 处的跳跃，所以它把它们抹掉了太多。 KDE 对您的 PDF 的估计下大约一半的区域最终位于这些涂抹区域下方。如果你替换你的 X1 的值比如说， X2 = np.linspace(-1,2,200)[:,np.newaxis] ，您可以看到 KDE 对 PDF 的估计在区间 [-1,0] 和 [1,2] 中的部分具有显着的密度。

关于python - 如何规范scikit学习的kde？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57431332/

24

4

0

文章推荐： reactjs - 如何在重新图表中在同一行中显示不同的笔画？

kde-plasma - 如何列出每个 KDE/Plasma5 事件的窗口
我正在尝试编写一个脚本，如果应用程序未运行则启动该应用程序，或者如果该窗口在当前事件中可见则激活该窗口。使用 xdotool 或 wmctrl 我能够获取窗口列表并激活它们。如果它们没有打开，那么我
kde-plasma - 如何删除 KDE Plasma 中的桌面选项卡
我想从 KDE Plasma 桌面环境中删除桌面选项卡并删除上下文菜单。有办法做到这一点吗？嗨，克里斯，感谢您的回复。我正在运行 KDE 4.14.8。我没有看到你在描述什么。上下文菜单是您在桌面上
c++ - 一种下载所有必需的 kde 依赖项以开始进行 kde 编程的方法？
我有 CentOS 6.4，它运行的是旧版本的 Qt，可能还有其他不兼容的版本组件，这使得在机器上启动 kde 编程变得非常困难。有没有办法一次性下载所有的依赖，让编程变得更简单？感谢任何帮助。谢
kde-plasma - 在 Kubuntu 上开发 KDE Plasma 小部件需要哪些软件包？
我想开发一个 KDE Plasma 小部件，但开发人员指南告诉我获取“KDE Trunk”来开始。我有三个问题: 我宁愿不要仅仅为了开发一个简单的小部件而获得 KDE 的全部源代码。我想为 Kubu
kde-plasma - 如何在 kde Plasma 5 中禁用 Kwallet？
已关闭。这个问题是 not about programming or software development 。目前不接受答案。这个问题似乎不是关于 a specific programming
KDE 和多显示器，如何在打开它的屏幕上启动程序
我一直在尝试 KDE 并根据我的喜好对其进行了足够的自定义。我在每个屏幕上添加了面板和应用程序启动器，并在每个屏幕面板上显示了打开的窗口。但是每当我从“开始菜单”或从快速启动启动应用程序时，它都会定
python - KDE 在处理大数据时非常慢
当我尝试制作一个按密度着色的散点图时，它需要很长时间。可能是因为数据的长度相当大。这基本上是我的做法: xy = np.vstack([np.array(x_values),np.array(y_
qt - KDE 任务栏进度
我正在尝试使用 KDE 框架在等 ionic 桌面的任务栏中显示进度。简而言之，当它复制文件时，它想做和 dolphin 一样的事情: 我有点卡住了，因为我什至不知道从哪里开始。我发现唯一有用的是KS
cmake - KDE 安装目录
我正在尝试为我的新 KDE 项目编写正确的 CMakeLists.txt 文件。但是，我在使用 KDE 安装目录时遇到了一些麻烦。我在 cmake 文件中的部分安装命令如下所示: INSTALL(T
c++ - KDE 贡献
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
linux - KDE 服务菜单问题
我在/home/user/.local/share/applications 中有这个 .desktop 文件 [Desktop Entry] Categories=AudioVideo;Video;
linux - KDE Plasma禁用启动应用程序
我想禁用kaccessible软件，而不卸载它，这样它在启动时就不会出现。而且，konsole在启动时也会自动启动，而无需我进行设置。我也不想再这样了。我需要编辑哪些文件才能实现这些功能？我试过一些方
linux - KDE 登录屏幕上预填的用户名存储在哪里
我们在开发人员工作站上大量使用 VirtualBox。由于我们经常与其他开发人员共享图像，因此我尝试尽可能地自动化此过程(清理 ap-get 缓存、删除 tmp 和日志文件...)。顺便说一下，我们使
linux - KDE 展览故障
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎不是关于 a specific programming problem, a software
kde-plasma - 双显示器不同分辨率
配置不同屏幕分辨率的双显示器环境的正确方法是什么？我在两个屏幕上的字体大小非常不同，我找不到如何为每个显示器配置不同的 dpi 或其他任何东西。提前致谢! 最佳答案答案取决于您的特定硬件。 DP
python - KDE 有两点失败？
以下简单示例返回奇异矩阵。为什么？有什么办法可以克服吗？ In: from scipy.stats import gaussian_kde Out: In: points Out: (array([
Linux KDE 登录脚本
我一直在尝试设置一个我想在登录时运行的服务器(以防计算机崩溃或类似情况)。该脚本有效，它在登录时运行，但它在后台运行或在我使用 ps -A 时运行，我可以看到进程正在运行。这没关系，但服务器是交互式
linux - 在不重新启动的情况下重新启动 KDE
关闭。这个问题是not about programming or software development .它目前不接受答案。这个问题似乎不是关于 a specific programming
python - 如何仅从直方图值创建 KDE？
我有一组值，我想绘制高斯核密度估计，但是我遇到了两个问题: 我只有条的值，没有值本身我正在绘制分类轴这是我到目前为止生成的情节: y 轴的顺序实际上是相关的，因为它代表了每个细菌物种的系统发育。
localization - KDE 中的错误/混合语言
KDE 升级后，我得到了一种混合语言。通常它必须是德语，但升级后大部分 KDE 都是英语。 echo $lang 的结果类似于:de_C.UTF-8 而不是 de_DE.UTF-8 所以国家设置似乎

首页

博学

6Ren·AI

商城

python - 如何规范scikit学习的kde？