python - 加速高斯 EM 算法-6ren

python - 加速高斯 EM 算法

转载作者：塔克拉玛干更新时间：2023-11-03 04:22:37

我的 python 代码如下...它需要很长时间。必须有一些我可以使用的 numpy 技巧吗？我正在分析的图片很小，而且是灰度的...

def gaussian_probability(x,mean,standard_dev):
        termA = 1.0 / (standard_dev*np.sqrt(2.0*np.pi))
        termB = np.exp(-((x - mean)**2.0)/(2.0*(standard_dev**2.0)))
        g = (termA*termB)
        return g
def sum_of_gaussians(x):
        return sum([self.mixing_coefficients[i] * 
                    gaussian_probability(x, self.means[i], self.variances[i]**0.5) 
                    for i in range(self.num_components)])
def expectation():
        dim = self.image_matrix.shape
        rows, cols = dim[0], dim[1]
        responsibilities = []
        for i in range(self.num_components):
            gamma_k = np.zeros([rows, cols])
            for j in range(rows):
                for k in range(cols):
                    p = (self.mixing_coefficients[i] *      
                         gaussian_probability(self.image_matrix[j,k],
                                              self.means[i], 
                                              self.variances[i]**0.5))
                    gamma_k[j,k] = p / sum_of_gaussians(self.image_matrix[j,k])
            responsibilities.append(gamma_k)
        return responsibilities

我只包括期望步骤，因为虽然最大化步骤循环遍历责任矩阵数组的每个元素，但它似乎进行得相对较快(所以瓶颈可能是所有的 gaussian_probability 计算？)

最佳答案

你可以通过做两件事来大大加快你的计算速度:

不要在每个循环中计算归一化!如目前所写，对于具有 M 个分量的 NxN 图像，您要计算每个相关计算 N * N * M 次，导致 O[N^4 M^2]算法!相反，您应该计算一次所有元素，然后除以总和，总和将为 O[N^2 M]。
使用 numpy 向量化而不是显式循环。这可以按照您设置代码的方式非常直接地完成。

本质上，您的expectation 函数应该如下所示:

def expectation(self):
    responsibilities = (self.mixing_coefficients[:, None, None] *
                        gaussian_probability(self.image_matrix,
                                             self.means[:, None, None],
                                             self.variances[:, None, None] ** 0.5))
    return responsibilities / responsibilities.sum(0)

您没有提供完整的示例，所以我不得不即兴创作一些来检查和基准测试，但这里有一个快速的例子:

import numpy as np

def gaussian_probability(x,mean,standard_dev):
    termA = 1.0 / (standard_dev*np.sqrt(2.0*np.pi))
    termB = np.exp(-((x - mean)**2.0)/(2.0*(standard_dev**2.0)))
    return termA * termB

class EM(object):
    def __init__(self, N=5):
        self.image_matrix = np.random.rand(20, 20)
        self.num_components = N
        self.mixing_coefficients = 1 + np.random.rand(N)
        self.means = 10 * np.random.rand(N)
        self.variances = np.ones(N)

    def sum_of_gaussians(self, x):
        return sum([self.mixing_coefficients[i] * 
                    gaussian_probability(x, self.means[i], self.variances[i]**0.5) 
                    for i in range(self.num_components)])

    def expectation(self):
        dim = self.image_matrix.shape
        rows, cols = dim[0], dim[1]
        responsibilities = []
        for i in range(self.num_components):
            gamma_k = np.zeros([rows, cols])
            for j in range(rows):
                for k in range(cols):
                    p = (self.mixing_coefficients[i] *      
                         gaussian_probability(self.image_matrix[j,k],
                                              self.means[i], 
                                              self.variances[i]**0.5))
                    gamma_k[j,k] = p / self.sum_of_gaussians(self.image_matrix[j,k])
            responsibilities.append(gamma_k)
        return responsibilities

    def expectation_fast(self):
        responsibilities = (self.mixing_coefficients[:, None, None] *
                            gaussian_probability(self.image_matrix,
                                                 self.means[:, None, None],
                                                 self.variances[:, None, None] ** 0.5))
        return responsibilities / responsibilities.sum(0)

现在我们可以实例化对象并比较期望步骤的两个实现:

em = EM(5)
np.allclose(em.expectation(),
            em.expectation_fast())
# True

看看时间，对于包含 5 个组件的 20x20 图像，我们的速度提高了大约 1000 倍:

%timeit em.expectation()
10 loops, best of 3: 65.9 ms per loop

%timeit em.expectation_fast()
10000 loops, best of 3: 74.5 µs per loop

随着图像大小和组件数量的增加，这种改进也会增加。祝你好运!

关于python - 加速高斯 EM 算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33707870/

文章推荐： java - getClass 方法的返回类型

文章推荐： java - bcprov 和 bcprov-ext 有何不同？

文章推荐： java - 查找已排序循环整数数组的起点索引

java - em.remove(st) 和 em.remove(em.contains(st) ? st : em. merge(st)); 有什么区别？
我遇到了这个错误: java.lang.IllegalArgumentException: Removing a detached instance model.student 然后我在stackov
xml - Firefox Addon - install.rdf - . .. 中的 "em"是什么意思
em在中是什么意思 ... 这是从 firefox 插件 install.rdf 文件中提取的。我很好奇 em 部分添加了什么。我在 Google 上也找不到解决方案。最佳答案 em 是包含 des

tibco-ems - 在 tibco ems 脚本中注释一行的语法是什么
在如下所示的脚本中 create queue one create queue two create topic three 如何评论一行？最佳答案我可以在工具本身或文档中找到注释。您可以做的最

ruby - EM :Connection (em-synchrony) 内的光纤
谁能解释一下为什么 Redis (redis-rb) 同步驱动程序直接在 EM.synchrony block 下工作，但不在 EM:Connection 内工作？考虑下面的例子 EM.sy

java - 如何使用java正则表达式从某物获取 "something"
在下面，我需要得到: String regex = "Item#: .*"; String content = "xxx Item#: something yyy"; Pattern pattern

css - em 和 % 在文本大小调整和固定宽度网站方面有什么区别？ em 比 % 更炒作吗？
em 和 % 在文本大小调整和固定宽度站点方面有什么区别？如果我使用 em 或 % 仅用于固定宽度站点中的文本大小调整，并且正文设置为 {body:font-size:100%} 在可访问性和移动设备

css - h1 em 和 h1 > em 的区别
这两个 CSS 语句有什么区别: h1 em { color:#ddd; } 和 h1 > em { color:#ddd; } 据我所知他们做的是完全一样的事情(虽然根据我在 W3C 上读到的第一种

css - 什么是字体的 "EM box/EM unit"，它在哪里定义
在CSS3 CSS Fonts Module Level 3 (candidate Oct 13) , 在第 2.3 节中有一个对“EM 盒”的引用和一个对“EM 单元”的引用。引用如下: [The

java - em.find 和 em.createQuery 有什么区别
em.find(Enity.classs, Id) em.createQuery("SELECT e From Entity e WHERE e.Id=:id") 它们是等价的吗？如果不是，它们有何不

html - 如果文档的字体大小以 em 指定，那么 "em"是什么？
在 CSS 中，em 是一个基于文档字体大小的相对单位。那么，如果文档本身的字体大小以em 为单位，那么em 到底是什么？假设我们说: body { font-size: 1em; }

php - $em->find(..) 和 $em->getRepository(..)->find(..) 的区别
有实体 /** * @ORM\Entity(repositoryClass="Some\Namspace\CustomRepository") * @ORM\Table(name="image_t

Symfony2 和 Doctrine $em->persist VS $em->merge
您好，我有一个关于 Doctrine 的快速问题以及 merge() 和 persist() 之间的区别我有一个 NewsBuilder 类: 这需要一个新闻实体并检查它是否存在于数据库，如果存在，

java - 更新不需要或不需要 em.persist() 或 em.merge() 吗？
我有下面的代码，想知道 JPA 如何知道保留此更新。我预计需要 em.merge() 才能执行更新。这真的安全吗？ @Stateless class User { ... public

java - JPA:em.flush() 之后的 em.clear() 会改变事务语义吗？
在 JPA 中，是否保证以下片段的事务语义(=从数据库的角度来看的效果)是相同的？片段A EntityManager em = ... List workList = ... for(Work wo

Ruby EventMachine - 如何将值从 EM::Deferrable 返回到主 EM 循环？
我现在正在使用 EventMachine 玩了几天，恕我直言，它的学习曲线很陡；-) 我尝试通过触发回调中需要的 HttpHeaderCrawler.query() 来返回哈希。但是在这种情况下我得到

html - EM、REM、PX - 将 PT 转换为 EM/REM
我有以下 HTML 代码: Hello World 我正在设计它的样式: h1 {font-size:100pt} 如何将此 100pt 转换为 EM 和 REM？最佳答案在 CSS 中， - p

opencv - EM::read() 在 OpenCV 中保存模型后得到不同的 EM::predict() 结果
我是 OpenCV 和 C++ 的新手，我正在尝试使用 OpenCV 中的高斯混合模型构建分类器。我弄清楚了它是如何工作的，并让它工作了……也许吧。我现在得到了这样的东西: 如果我在模型训练和保存后立

c# - C# 的 TIBCO EMS 故障转移重新连接 (TIBCO.EMS.dll)
我们有一个 TIBCO EMS 解决方案，它在 2-4 服务器环境中使用内置服务器故障转移。如果 TIBCO 管理员将服务从一台 EMS 服务器故障转移到另一台，则连接应该会在 EMS 服务级别自动转

css - YUI 重置 CSS 使这不起作用
YUI 中的这一行 Reset CSS给我带来了麻烦: address,caption,cite,code,dfn,em,strong,th,var { font-style: normal;

ruby - 想知道 EM-Synchrony 、em-http-request 和 fiber 的关系吗？
我想并发下载网页，所以我找到了这些库，但是我分不清em-synchrony和em-http-request的关系？我查看了每个存储库的 github，但似乎所有示例都是关于自己的，但是从一些文章

塔克拉玛干

个人简介
我是一名优秀的程序员,十分优秀！

作者热门文章

iOS/Objective-C 元类和类别

objective-c - -1001 错误，当 NSURLSession 通过 httpproxy 和/etc/hosts

java - 使用网络类获取 url 地址

ios - 推送通知中不播放声音

滴滴打车优惠券免费领取

全站热门文章

全网最适合入门的面向对象编程教程：56Python字符串与序列化-正则表达式和re模块应用

如何创建免费版本的ABP分离模块？

团队管理的两大入门心法

多Master节点的k8s集群部署-完整版

OpenAI发布适用于.NET库的稳定版本

Windows应急响应-QQ巨盗病毒

浏览器中生成OSS令牌|WebCryptoAPI

（系列五）.net8中使用Dapper搭建底层仓储连接数据库（附源码）

【VMwareVCF】使用SFTP服务器备份VCF核心组件的配置文件。

从零开始学机器学习——网络应用

首页

博学

6Ren·AI

商城

python - 加速高斯 EM 算法