python - Cython 代码比 Python/Numpy 代码慢 3-4 倍？-6ren

python - Cython 代码比 Python/Numpy 代码慢 3-4 倍？

转载作者：太空狗更新时间：2023-10-29 22:16:29

我正在尝试将我的 Python/Numpy 代码转换为 Cython 代码以达到加速目的。然而，Cython 比 Python/Numpy 代码慢得多(3-4 倍)。我是否正确使用了 Cython？我是否在我的 Cython 代码中正确地将参数传递给 myc_rb_etc() ？当我调用集成功能时怎么办？预先感谢您的帮助。这是我的 Python/Numpy 代码:

from pylab import * 
import pylab as pl
from numpy import *
import numpy as np
from scipy import integrate

def myc_rb_e2f(y,t,k,d):

    M = y[0]
    E = y[1]
    CD = y[2]
    CE = y[3]
    R = y[4]
    RP = y[5] 
    RE = y[6]

    S = 0.01
    if t > 300:
        S = 5.0
    #if t > 400
        #S = 0.01

    t1 = k[0]*S/(k[7]+S);
    t2 = k[1]*(M/(k[14]+M))*(E/(k[15]+E));
    t3 = k[5]*M/(k[14]+M);
    t4 = k[11]*CD*RE/(k[16]+RE);
    t5 = k[12]*CE*RE/(k[17]+RE);
    t6 = k[2]*M/(k[14]+M);
    t7 = k[3]*S/(k[7]+S);
    t8 = k[6]*E/(k[15]+E);
    t9 = k[13]*RP/(k[18]+RP);
    t10 = k[9]*CD*R/(k[16]+R);
    t11 = k[10]*CE*R/(k[17]+R);

    dM = t1-d[0]*M
    dE = t2+t3+t4+t5-k[8]*R*E-d[1]*E
    dCD = t6+t7-d[2]*CD
    dCE = t8-d[3]*CE
    dR = k[4]+t9-k[8]*R*E-t10-t11-d[4]*R
    dRP = t10+t11+t4+t5-t9-d[5]*RP
    dRE = k[8]*R*E-t4-t5-d[6]*RE

    dy = [dM,dE,dCD,dCE,dR,dRP,dRE]

    return dy

t = np.zeros(10000)
t = np.linspace(0.,3000.,10000.)

# Initial concentrations of [M,E,CD,CE,R,RP,RE]
y0 = np.array([0.,0.,0.,0.,0.4,0.,0.25])
E_simulated = np.zeros([10000,5000])
E_avg = np.zeros([10000])
k = np.zeros([19])
d = np.zeros([7])

for i in range (0,5000):
    k[0] = 1.+0.1*randn(1)
    k[1] = 0.15+0.05*randn(1)
    k[2] = 0.2+0.05*randn(1)
    k[3] = 0.2+0.05*randn(1)
    k[4] = 0.35+0.05*randn(1)
    k[5] = 0.001+0.0001*randn(1)
    k[6] = 0.5+0.05*randn(1)
    k[7] = 0.3+0.05*randn(1)
    k[8] = 30.+5.*randn(1)
    k[9] = 18.+3.*randn(1)
    k[10] = 18.+3.*randn(1)
    k[11] = 18.+3.*randn(1)
    k[12] = 18.+3.*randn(1)
    k[13] = 3.6+0.5*randn(1)
    k[14] = 0.15+0.05*randn(1)
    k[15] = 0.15+0.05*randn(1)
    k[16] = 0.92+0.1*randn(1)
    k[17] = 0.92+0.1*randn(1)
    k[18] = 0.01+0.001*randn(1)
    d[0] = 0.7+0.05*randn(1)
    d[1] = 0.25+0.025*randn(1)
    d[2] = 1.5+0.05*randn(1)
    d[3] = 1.5+0.05*randn(1)
    d[4] = 0.06+0.01*randn(1)
    d[5] = 0.06+0.01*randn(1)
    d[6] = 0.03+0.005*randn(1)
    r = integrate.odeint(myc_rb_e2f,y0,t,args=(k,d))
    E_simulated[:,i] = r[:,1]

for i in range(0,10000):
    E_avg[i] = sum(E_simulated[i,:])/5000.

pl.plot(t,E_avg,'-ro')
pl.show()

这是转换成 Cython 的代码:

cimport numpy as np
import numpy as np
from numpy import *
import pylab as pl
from pylab import * 
from scipy import integrate

def myc_rb_e2f(y,t,k,d):

    cdef double M = y[0]
    cdef double E = y[1]
    cdef double CD = y[2]
    cdef double CE = y[3]
    cdef double R = y[4]
    cdef double RP = y[5] 
    cdef double RE = y[6]

    cdef double S = 0.01
    if t > 300.0:
        S = 5.0
    #if t > 400
        #S = 0.01

    cdef double t1 = k[0]*S/(k[7]+S)
    cdef double t2 = k[1]*(M/(k[14]+M))*(E/(k[15]+E))
    cdef double t3 = k[5]*M/(k[14]+M)
    cdef double t4 = k[11]*CD*RE/(k[16]+RE)
    cdef double t5 = k[12]*CE*RE/(k[17]+RE)
    cdef double t6 = k[2]*M/(k[14]+M)
    cdef double t7 = k[3]*S/(k[7]+S)
    cdef double t8 = k[6]*E/(k[15]+E)
    cdef double t9 = k[13]*RP/(k[18]+RP)
    cdef double t10 = k[9]*CD*R/(k[16]+R)
    cdef double t11 = k[10]*CE*R/(k[17]+R)

    cdef double dM = t1-d[0]*M
    cdef double dE = t2+t3+t4+t5-k[8]*R*E-d[1]*E
    cdef double dCD = t6+t7-d[2]*CD
    cdef double dCE = t8-d[3]*CE
    cdef double dR = k[4]+t9-k[8]*R*E-t10-t11-d[4]*R
    cdef double dRP = t10+t11+t4+t5-t9-d[5]*RP
    cdef double dRE = k[8]*R*E-t4-t5-d[6]*RE

    dy = [dM,dE,dCD,dCE,dR,dRP,dRE]

    return dy


def main():
    cdef np.ndarray[double,ndim=1] t = np.zeros(10000)
    t = np.linspace(0.,3000.,10000.)
    # Initial concentrations of [M,E,CD,CE,R,RP,RE]
    cdef np.ndarray[double,ndim=1] y0 = np.array([0.,0.,0.,0.,0.4,0.,0.25])
    cdef np.ndarray[double,ndim=2] E_simulated = np.zeros([10000,5000])
    cdef np.ndarray[double,ndim=2] r = np.zeros([10000,7])
    cdef np.ndarray[double,ndim=1] E_avg = np.zeros([10000])
    cdef np.ndarray[double,ndim=1] k = np.zeros([19])
    cdef np.ndarray[double,ndim=1] d = np.zeros([7])
    cdef int i
    for i in range (0,5000):
        k[0] = 1.+0.1*randn(1)
        k[1] = 0.15+0.05*randn(1)
        k[2] = 0.2+0.05*randn(1)
        k[3] = 0.2+0.05*randn(1)
        k[4] = 0.35+0.05*randn(1)
        k[5] = 0.001+0.0001*randn(1)
        k[6] = 0.5+0.05*randn(1)
        k[7] = 0.3+0.05*randn(1)
        k[8] = 30.+5.*randn(1)
        k[9] = 18.+3.*randn(1)
        k[10] = 18.+3.*randn(1)
        k[11] = 18.+3.*randn(1)
        k[12] = 18.+3.*randn(1)
        k[13] = 3.6+0.5*randn(1)
        k[14] = 0.15+0.05*randn(1)
        k[15] = 0.15+0.05*randn(1)
        k[16] = 0.92+0.1*randn(1)
        k[17] = 0.92+0.1*randn(1)
        k[18] = 0.01+0.001*randn(1)
        d[0] = 0.7+0.05*randn(1)
        d[1] = 0.25+0.025*randn(1)
        d[2] = 1.5+0.05*randn(1)
        d[3] = 1.5+0.05*randn(1)
        d[4] = 0.06+0.01*randn(1)
        d[5] = 0.06+0.01*randn(1)
        d[6] = 0.03+0.005*randn(1)
        r = integrate.odeint(myc_rb_e2f,y0,t,args=(k,d))
        E_simulated[:,i] = r[:,1]
    for i in range(0,10000):
        E_avg[i] = sum(E_simulated[i,:])/5000.
    pl.plot(t,E_avg,'-ro')
    pl.show()

以下是我的 Python/Numpy 代码上来自 cProfile 的一些 pstats:

ncalls tottime percall cumtime percall

5000 82.505 0.017 236.760 0.047 {scipy.integrate._odepack.odeint}

1 1.504 1.504 238.949 238.949 myc_rb_e2f.py:1(<module>)

5000 0.025 0.000 236.855 0.047 C:\Python27\lib\site-packages\scipy\integrate\odepack.py:18(odeint)

12291237 154.255 0.000 154.255 0.000 myc_rb_e2f.py:7(myc_rb_e2f)

最佳答案

更改函数定义以包括参数类型:

def myc_rb_e2f(np.ndarray[double,ndim=1]y, double t, np.ndarray[double, ndim=1] k, np.ndarray[double, ndim=1] d):

这将使运行时间比 numpy 实现提高大约 3 倍，比最初的 cython 实现提高 6 - 7 倍。仅供引用，我降低了迭代次数，这样我就不必在测试时永远等待它完成。它应按您所需的迭代次数进行扩展。

[pkerp@plastilin so]$ time python run_numpy.py

real    0m47.572s
user    0m45.702s
sys     0m0.049s

[pkerp@plastilin so]$ time python run_cython1.py

real    1m14.851s
user    1m12.308s
sys     0m0.135s

[pkerp@plastilin so]$ time python run_cython2.py

real    0m15.774s
user    0m14.115s
sys     0m0.105s

编辑:

此外，您不必在每次要从 myc_rb_e2f 返回结果时都创建一个新数组。你可以只在 main 中声明一个结果数组，在每次调用时传递它，然后填充它。这将为你节省很多不必要的分配。这超过了之前最佳运行时间的一半:

[pkerp@plastilin so]$ time python run_cython3.py

real    0m6.165s
user    0m4.818s
sys     0m0.152s

还有代码:

cimport numpy as np
import numpy as np
from numpy import *
import pylab as pl
from pylab import * 
from scipy import integrate

def myc_rb_e2f(np.ndarray[double,ndim=1]y, double t, np.ndarray[double, ndim=1] k, np.ndarray[double, ndim=1] d, np.ndarray[double, ndim=1] res):

    cdef double S = 0.01
    if t > 300.0:
        S = 5.0
    #if t > 400
        #S = 0.01

    cdef double t1 = k[0]*S/(k[7]+S)
    cdef double t2 = k[1]*(y[0]/(k[14]+y[0]))*(y[1]/(k[15]+y[1]))
    cdef double t3 = k[5]*y[0]/(k[14]+y[0])
    cdef double t4 = k[11]*y[2]*y[6]/(k[16]+y[6])
    cdef double t5 = k[12]*y[3]*y[6]/(k[17]+y[6])
    cdef double t6 = k[2]*y[0]/(k[14]+y[0])
    cdef double t7 = k[3]*S/(k[7]+S)
    cdef double t8 = k[6]*y[1]/(k[15]+y[1])
    cdef double t9 = k[13]*y[5]/(k[18]+y[5])
    cdef double t10 = k[9]*y[2]*y[4]/(k[16]+y[4])
    cdef double t11 = k[10]*y[3]*y[4]/(k[17]+y[4])

    cdef double dM = t1-d[0]*y[0]
    cdef double dE = t2+t3+t4+t5-k[8]*y[4]*y[1]-d[1]*y[1]
    cdef double dCD = t6+t7-d[2]*y[2]
    cdef double dCE = t8-d[3]*y[3]
    cdef double dR = k[4]+t9-k[8]*y[4]*y[1]-t10-t11-d[4]*y[4]
    cdef double dRP = t10+t11+t4+t5-t9-d[5]*y[5]
    cdef double dRE = k[8]*y[4]*y[1]-t4-t5-d[6]*y[6]

    res[0] = dM
    res[1] = dE
    res[2] = dCD
    res[3] = dCE
    res[4] = dR
    res[5] = dRP
    res[6] = dRE

    return res


def main():
    cdef np.ndarray[double,ndim=1] t = np.zeros(467)
    cdef np.ndarray[double,ndim=1] results = np.zeros(7)
    t = np.linspace(0.,3000.,467.)
    # Initial concentrations of [M,E,CD,CE,R,RP,RE]
    cdef np.ndarray[double,ndim=1] y0 = np.array([0.,0.,0.,0.,0.4,0.,0.25])
    cdef np.ndarray[double,ndim=2] E_simulated = np.zeros([467,554])
    cdef np.ndarray[double,ndim=2] r = np.zeros([467,7])
    cdef np.ndarray[double,ndim=1] E_avg = np.zeros([467])
    cdef np.ndarray[double,ndim=1] k = np.zeros([19])
    cdef np.ndarray[double,ndim=1] d = np.zeros([7])
    cdef int i
    for i in range (0,554):
        k[0] = 1.+0.1*randn(1)
        k[1] = 0.15+0.05*randn(1)
        k[2] = 0.2+0.05*randn(1)
        k[3] = 0.2+0.05*randn(1)
        k[4] = 0.35+0.05*randn(1)
        k[5] = 0.001+0.0001*randn(1)
        k[6] = 0.5+0.05*randn(1)
        k[7] = 0.3+0.05*randn(1)
        k[8] = 30.+5.*randn(1)
        k[9] = 18.+3.*randn(1)
        k[10] = 18.+3.*randn(1)
        k[11] = 18.+3.*randn(1)
        k[12] = 18.+3.*randn(1)
        k[13] = 3.6+0.5*randn(1)
        k[14] = 0.15+0.05*randn(1)
        k[15] = 0.15+0.05*randn(1)
        k[16] = 0.92+0.1*randn(1)
        k[17] = 0.92+0.1*randn(1)
        k[18] = 0.01+0.001*randn(1)
        d[0] = 0.7+0.05*randn(1)
        d[1] = 0.25+0.025*randn(1)
        d[2] = 1.5+0.05*randn(1)
        d[3] = 1.5+0.05*randn(1)
        d[4] = 0.06+0.01*randn(1)
        d[5] = 0.06+0.01*randn(1)
        d[6] = 0.03+0.005*randn(1)
        r = integrate.odeint(myc_rb_e2f,y0,t,args=(k,d,results))
        E_simulated[:,i] = r[:,1]
    for i in range(0,467):
        E_avg[i] = sum(E_simulated[i,:])/554.
    #pl.plot(t,E_avg,'-ro')
    #pl.show()

if __name__ == "__main__":
    main()

关于python - Cython 代码比 Python/Numpy 代码慢 3-4 倍？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13044515/

文章推荐： python - 使用 Python cmd 模块的命令的别名

文章推荐： python - 如何使用 Python 在 Cloud9 中声明端口

文章推荐： python - Outerzip/zip 最长功能(具有多个填充值)

文章推荐： c# - Datagrid selectedItem 和数据绑定(bind)

cython - cython 何时以及如何进行边界检查？
c 不做边界检查。那么cython是如何检查是否编译成c的呢？ %%cython --annotate cimport cython @cython.boundscheck(True) cpdef m
cython - Cython 中的
可以直接声明用于 Cython 构造函数？据我了解，这是可能的: # Cython cdef int[3] li = [1, 2, 3] # C++ int[3] li = {1, 2, 3} 但
cython - 在 Cython 中将结构自动转换为字典
所以，如果你有一个头文件。 %%file test.h struct mystruct{ int i; int j; }; 然后你将它包装在 Cython 中: cdef extern fr
cython - 如何在定义 cython 扩展之前识别编译器？
我正在构建一个独立于平台的 cython 项目，我想根据正在使用的编译器传递编译器参数。我可以猜测基于平台的编译器，或者假设它与用于 Python 的编译器相同，但不能保证匹配。通常我注入(injec
cython - 诗歌+狮身人面像+Cython
我使用诗歌构建我的 cython 包。我在所有函数和类中都有 NumPy 风格的文档字符串。我现在要做的是添加 Sphinx 自动文档并发布在 Read the Docs。我已阅读此主题 How d
cython - 将自定义比较器传递给 Cython 中的优先级队列
赛通 libcpp模块包含 priority_queue 的模板，这很好，除了一件事:我不能通过自定义比较器(或者，至少，我不知道如何)。我需要这个，因为我需要 priority_queue做一个a
cython - 如何在文档中显示 Cython 函数的参数？
以下代码定义了一个简单的 Cython 函数(为方便起见，使用 Ipython 魔法)。 %load_ext cython %%cython def f(float x, float y=2):
cython - 使用 Cython 进行复值计算
我正在尝试使用 cython 进行复数计算。在示例代码中，我想计算复数的复指数函数。问题是我不知道如何将我的整数乘以虚数单位。python的虚数单位1.0j乘以cython执行时报错。这是我的代码:
cython - 在 Cython 中定义字符串数组
在这里停留在一些基本的 Cython 上 - 在 Cython 中定义字符串数组的规范且有效的方法是什么？具体来说，我想定义一个定长常量数组char . (请注意，此时我不想引入 NumPy。) 在
cython - 在 Cython 中在编译时获取整数的大小
是否有可能，如果是，如何确定 Cython 中整数数据类型的大小(以位为单位)？我正在尝试做这样的事情，以获得整数大小: cdef WORD_BITS = 0 IF sizeof(unsigned
cython - 打印 cython 变量的地址
我只是想打印 cython 变量的地址，但我无法绕过错误消息: cdef int myvar print &myvar 抛出 Cannot convert 'int *' to Python obje
cython - 如何在 Cython 中扩展宏
我有一个 C 头文件，它在宏中定义了一个函数。我需要从 Cython 调用它。有没有办法在 Cython 中使用宏并使其完全扩展？我已经有了 C 类型的参数。我尝试像使用函数一样使用 cdef，我认
cython - 在 Cython 中获取结构元素
令人惊讶的是，我似乎找不到通过名称获取结构体元素的单个示例(无论是在网络上还是在 cython 示例中)。所以我收到了一个指向 C 函数结构体的指针，并且想要一一访问这些元素并将它们重新打包到 py
cython - 我的 Cython 有什么问题？
我尝试围绕 C++ 库编写一个 Cython 包装器 http://primesieve.org/ 它包装了一个函数count。到目前为止，它可以正确安装 python setup.py instal
python - Cython:ImportError:没有名为 'myModule' 的模块:如何将包含 cimport 的 cython 模块调用到另一个 cython 结节？
我正在尝试将 cython 模块 data.pyx 导入另一个 cython 模块 user.pyx。一切都编译得很好，但是当我尝试在 python 模块中调用 user.pyx 时，我收到错误“Im
cython - Bakeoff 第 1 部分 Python vs Cython vs Cython 类型化内存 View : LDA by Gibbs Sampling
更新:内存 View 获胜。Cython 使用类型化内存 View :0.0253449 特别感谢 lothario，他指出了几个关键的变化。荒谬。当然现在的问题是，似乎不能对它们做太多算术(加法和
cython - 为什么不能腌制 cython 内存 View ？
我有一个使用 memoryview 数组的 cython 模块，即... double[:,:] foo 我想使用多处理并行运行这个模块。但是我得到了错误: PicklingError: Can't
cython - mypy 不喜欢别名 Cython 类型
我正在尝试使用 Cython 加速 PEP 484 类型的 python 脚本。我想保持一些语义和可读性。之前，我有一个 Flags = int def difference(f1: Flags,
cython - 使用 cython 为一组文件制作一个 pyd
这个问题已经有答案了: Collapse multiple submodules to one Cython extension (5 个回答) 已关闭 3 年前。我在一个包中有多个 .py 文件
cython - 如何分发从 cython 生成的 .so 文件
我已经能够在我的 .pyx 脚本上使用 cython 在 linux 上创建一个 .so 文件。我也可以成功地在我的 python 解释器上进行导入。我的问题是如何在不使用 cython 的情况下将

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Cython 代码比 Python/Numpy 代码慢 3-4 倍？