python - 长尾小鹦鹉与 Numba 有何不同？因为我没有看到某些 NumPy 表达式有任何改进-6ren

python - 长尾小鹦鹉与 Numba 有何不同？因为我没有看到某些 NumPy 表达式有任何改进

转载作者：太空狗更新时间：2023-10-30 02:45:39

30

4

我想知道是否有人知道长尾小鹦鹉和 Numba jit 之间的一些主要区别？我很好奇，因为我正在将 Numexpr 与 Numba 和长尾小鹦鹉进行比较，并且对于这个特定的表达式(我希望它在 Numexpr 上表现得非常好，因为它是它的文档中提到的)

所以结果是

enter image description here

和我测试的功能(通过 timeit - 每个功能至少重复 3 次和 10 次循环)

import numpy as np
import numexpr as ne
from numba import jit as numba_jit
from parakeet import jit as para_jit


def numpy_complex_expr(A, B):
    return(A*B-4.1*A > 2.5*B)

def numexpr_complex_expr(A, B):
    return ne.evaluate('A*B-4.1*A > 2.5*B')

@numba_jit
def numba_complex_expr(A, B):
    return A*B-4.1*A > 2.5*B

@para_jit
def parakeet_complex_expr(A, B):
    return A*B-4.1*A > 2.5*B

我你也可以抢IPython nb如果您想在您的机器上仔细检查结果。

如果有人想知道 Numba 是否安装正确......我想是的，它在我之前的基准测试中的表现符合预期:

enter image description here

最佳答案

截至当前版本的 Numba(您在测试中使用的)，@jit 函数对 ufunc 的支持不完整。另一方面，您可以使用 @vectorize 并且速度更快:

import numpy as np
from numba import jit, vectorize
import numexpr as ne

def numpy_complex_expr(A, B):
    return(A*B+4.1*A > 2.5*B)

def numexpr_complex_expr(A, B):
    return ne.evaluate('A*B+4.1*A > 2.5*B')

@jit
def numba_complex_expr(A, B):
    return A*B+4.1*A > 2.5*B

@vectorize(['u1(float64, float64)'])
def numba_vec(A,B):
    return A*B+4.1*A > 2.5*B

n = 1000
A = np.random.rand(n,n)
B = np.random.rand(n,n)

计时结果:

%timeit numba_complex_expr(A,B)
1 loops, best of 3: 49.8 ms per loop

%timeit numpy_complex_expr(A,B)
10 loops, best of 3: 43.5 ms per loop

%timeit numexpr_complex_expr(A,B)
100 loops, best of 3: 3.08 ms per loop

%timeit numba_vec(A,B)
100 loops, best of 3: 9.8 ms per loop

如果您想充分利用 numba，那么您需要展开任何矢量化操作:

@jit
def numba_unroll2(A, B):
    C = np.empty(A.shape, dtype=np.uint8)
    for i in xrange(A.shape[0]):
        for j in xrange(A.shape[1]):
            C[i,j] = A[i,j]*B[i,j] + 4.1*A[i,j] > 2.5*B[i,j]

    return C

%timeit numba_unroll2(A,B)
100 loops, best of 3: 5.96 ms per loop

另请注意，如果将 numexpr 使用的线程数设置为 1，那么您会发现它的主要速度优势在于它是并行化的:

ne.set_num_threads(1)
%timeit numexpr_complex_expr(A,B)
100 loops, best of 3: 8.87 ms per loop

默认情况下，numexpr 使用 ne.detect_number_of_cores() 作为线程数。对于我机器上的原始计时，它使用的是 8。

关于python - 长尾小鹦鹉与 Numba 有何不同？因为我没有看到某些 NumPy 表达式有任何改进，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23776547/

30

4

0

文章推荐： python - 防止为特定的 save() 调用发送信号

文章推荐： python - 为什么 python str.format 不调用 str()

r - 看到 R 字符串的确切字节序列了吗？
如何获取特定 UTF-8 字符串的字节序列？我看到正则表达式引擎中的某些错误仅在某些边缘情况下才会触发，我想确切地知道它正在处理哪些数据。最佳答案也许 charToRaw ? > charToRa
java - 看到 Java 程序运行时变量值发生变化吗？
考虑一个具有许多变量的 java 程序，其中一些是循环计数器，我希望看到这些变量随时间变化的值，而不是在代码中到处放置 print 语句。为什么？我认为它可以帮助我轻松调试。 Example- in
javascript - 看到 JavaScript 正在创建的线程了吗？
有没有办法查看 JavaScript 正在创建的“线程”？例如，如果我有一个附加到 DOM 元素的事件处理程序，我假设 JavaScript 会隐式地创建一个新线程来在后台运行该代码？如果是这样，有没
java - 看到 InvokingTargetException 异常
我正在使用反射 API 来调用类运行时并调用其方法。但我看到 java.lang.reflect.InitationTargetException 异常。我需要调用一个名为 - TestClass
windows - 命令脚本退出代码未被同一行 && 或 || 看到？
考虑一个名为 t.cmd 的命令脚本，它只包含以下两行: @exit /b 123 @echo If you see this, THEN EXIT FAILED.. 因此，该脚本只是将脚本执行过程的
ruby - 看到 Ruby 的内幕了吗？
我最近一直在努力学习编程语言实用学第 3 版，以了解更多关于语言在底层如何工作的信息，并且通过查看由真正基本的 GCC 编译的 C 代码生成的程序集，我获得了很多进展.我开始对 C 系列的静态语言越来
flash - 如何让 QtWebKit 看到 Flash？
最简单的制作方法是什么QWebView识别并正确加载网页上的 Flash？最佳答案似乎只需两行即可实现(当然，假设目标系统上安装了闪存): QWebSettings *settings = QWe
vba - VBA，Outlook，看到“人民日历”
我想通过编程（使用VBA）访问其他人与我共享的日历。它们在我的Outlook中的“人民日历”下列出。我在网上搜索了此内容，所有建议所做的仅使我感到困惑。如何从“人的日历”中获取共享给我的所有日历的
mongodb-compass - 看到/设置MongoDB Compass用户？
使用MongoDB Compass，可以看到数据库用户或创建新用户吗？最佳答案香港专业教育学院在命令行上使用以下命令进行管理: mongo use (my database name) db.cr
xml - 除非我在oXygen上手动编辑文件，否则eXist-db不会对通过XQuery更新插入添加的新记录进行索引(“看到”)
我正在CentOS 7.4.1708（核心），Java（TM）SE运行时环境（内部版本1.8.0_152-b16）上运行eXist-db 3.6.1。我希望能够在person.xml中的最后一个记录之
sql - 在事务提交之前，在事务中进行的插入是否可以通过 SELECT 看到
我需要确认。客户端 1 在事务内的表中插入行。客户端 2 使用 SELECT 请求该表。如果在此客户端上隔离级别设置为 READ COMMITTED，您能否确认 SELECT 不会返回客户端 1
python - 如何让 Python 看到 librt？
我刚刚安装了 python-dev: $ sudo apt-get install python-dev 这样我就可以开始使用 P4Python 了。但是当我尝试导入 P4 时，我得到: Traceb
c++ - 如何让 libtorrent 看到 boost ？
我正在使用 msys 和 mingw 编译 libtorrent-rasterbar-0.16.16。./configure 运行良好，直到它进入 boost 库检查。我有 boost 1.51，我设
go - Travis 看到 GO 函数的旧签名并且不会构建
我在 GO 项目的 Travis CI 上有一个奇怪的行为。 [这里] 失败了，提示一个函数只接受 1 个参数并用 2 个参数调用。 src/finances-service/main.go:45:1
java - 看到 enum 后对 Java 中的类型声明感到困惑
这个问题已经有答案了: What are enums and why are they useful? (27 个回答) 已关闭 4 年前。作为 Java 初学者，我接触到了枚举，这让我对类型声明感
facebook - 为什么我的 Facebook 个人资料无法从外部(注销时)看到？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
javascript - preactjs 看到 [Object object] 而不是链接
我正在使用 preactjs 创建我的应用程序。最重要的是，我正在使用剑道网格。在网格内，我想显示一个超链接。如果用户点击链接，它应该改变路线。为了呈现链接，我使用了 preact-router。这
node.js - 看到 Node.js 中的函数签名了吗？
有没有办法只查看 Node.js 中的函数签名？我知道 fn.toString() 但不需要所有代码，只需要签名。最佳答案 var source = fn.toString(); var signa
ruby - 让 Vim 看到 RVM ubuntu
如何设置 vim 以查看我在 ubuntu 上安装的 ruby rvm。 rvm 已安装，ruby 从终端返回。 renshaw@renshaw-TravelMate-5740G:~$ ruby
android - 试图防止 OutOfMemoryError 看到 MAT - Android
我试图在我的 Android 应用程序中防止 OutOfMemoryError。我已经阅读了很多帖子，但我仍然无法解决。该应用程序有后台 Activity ，所以我认为这是主要问题。 OutOfMe

首页

博学

6Ren·AI

商城

python - 长尾小鹦鹉与 Numba 有何不同？因为我没有看到某些 NumPy 表达式有任何改进