- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
所以如果我有类似 x=np.random.rand(60000)*400-200
的东西. iPython 的 %timeit
说:
x.astype(int)
耗时 0.14 毫秒np.rint(x)
和 np.around(x)
耗时 1.01 毫秒请注意,在 rint
中和 around
情况下你仍然需要花费额外的 0.14ms 来做最后的 astype(int)
(假设这是您最终想要的)。
问题:我认为大多数现代硬件能够同时执行这两项操作是否正确?如果是这样,为什么 numpy 的舍入时间要长 8 倍?
碰巧我对算术的准确性不是很挑剔,但我看不出如何利用 numpy 来利用它(我正在研究困惑的生物学而不是粒子物理学)。
最佳答案
np.around(x).astype(int)
和 x.astype(int)
不要产生相同的值。前者四舍五入(与 ((x*x>=0+0.5) + (x*x<0-0.5)).astype(int)
相同),而后者四舍五入为零。然而,
y = np.trunc(x).astype(int)
z = x.astype(int)
显示y==z
但正在计算 y
慢得多。所以它是 np.trunc
和 np.around
慢的函数。
In [165]: x.dtype
Out[165]: dtype('float64')
In [168]: y.dtype
Out[168]: dtype('int64')
所以 np.trunc(x)
从 double 到 double 向零舍入。然后 astype(int)
必须将 double 转换为 int64。
在内部我不知道 python 或 numpy 在做什么,但我知道我将如何在 C 中执行此操作。让我们讨论一些硬件。使用 SSE4.1 可以使用 round、floor、ceil 和 trunc 从 double 到 double 使用:
_mm_round_pd(a, 0); //round: round even
_mm_round_pd(a, 1); //floor: round towards minus infinity
_mm_round_pd(a, 2); //ceil: round towards positive infinity
_mm_round_pd(a, 3); //trunc: round towards zero
但 numpy 也需要支持没有 SSE4.1 的系统,因此它必须在没有 SSE4.1 和 SSE4.1 的情况下构建,然后使用调度程序。
但是在 AVX512 之前,使用 SSE/AVX 将 double 直接转换为 int64 并不高效。但是,仅使用 SSE2 就可以有效地将 double 舍入为 int32:
_mm_cvtpd_epi32(a); //round double to int32 then expand to int64
_mm_cvttpd_epi32(a); //trunc double to int32 then expand to int64
这些将两个 double 转换为两个 int64。
在您的情况下,这会很好地工作,因为范围肯定在 int32 范围内。但是,除非 python 知道范围适合 int32,否则它不能假设这一点,因此它必须四舍五入或截断到 int64,这很慢。此外,无论如何,numpy 都必须构建以支持 SSE2 才能执行此操作。
但也许您可以使用单个 float 组开始。在那种情况下你可以这样做:
_mm_cvtps_epi32(a); //round single to int32
_mm_cvttps_epi32(a) //trunc single to int32
这些将四个单打转换为四个 int32。
因此,为了回答您的问题,SSE2 可以有效地将 double 舍入或截断为 int32。 AVX512 也可以使用 _mm512_cvtpd_epi64(a)
有效地将 double 舍入或截断为 int64。或 _mm512_cvttpd_epi64(a)
. SSE4.1 可以高效地将 float /截断/地板/天花板从 float 到 float 或加倍到加倍。
关于python - 与 astype(int) 相比,numpy around/rint 慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27252209/
我正在尝试使用 y 组合器在 Scala 中定义 gcd: object Main { def y[A,B]( f : (A => B) => A => B ) : A => B = f(y(f)
我正在尝试了解返回指向函数的指针的函数,在我尝试编译代码后,它给了我这种错误: cannot convert int (*(int))(int) to int (*(int))(int) in ass
所以我一直在关注 youtube 上的游戏编程教程,然后弹出了这段代码:bufferedImageObject.getRGB(int, int, int, int, int[], int, int);
我正在将时间现在 与存储在数据库某处的时间进行比较。数据库中存储的时间格式为“yyyyMMddHHmmss”。例如,数据库可能会为存储的时间值返回 201106203354。然后我使用一个函数将时间现
例如 Maze0.bmp (0,0) (319,239) 65 120 Maze0.bmp (0,0) (319,239) 65 120 (254,243,90) Maze0.bmp (0,0) (
评论 Steve Yegge的post关于 server-side Javascript开始讨论语言中类型系统的优点和这个 comment描述: ... examples from H-M style
我正在研究 C 的指针,从 Deitel 的书中我不明白 int(*function)(int,int) 和 int*function(int, int) 表示函数时。 最佳答案 C 中读取类型的经验
您好,我使用 weblogic 11g 创建 war 应用程序,我对 joda time 的方法有疑问 new DateTime(int, int, int, int, int, int); 这抛出了
Create a method called average that calculates the average of the numbers passed as parameters. The
var a11: Int = 0 var a12: Int = 0 var a21: Int = 0 var a22: Int = 0 var valueDeterminant = a11 * a12
我正在为一个项目设置 LED 阵列。我得到了一个 LED 阵列,可以根据引脚变化电压进行更改,但我无法添加更多引脚。 当我尝试时,编译失败并显示错误:函数“int getMode(int, int,
除了创建对列表执行简单操作的函数之外,我对 haskell 还是很陌生。我想创建一个列表,其中包含 Int 类型的内容, 和 Int -> Int -> Int 类型的函数. 这是我尝试过的: dat
这个问题已经有答案了: Java add buttons dynamically as an array [duplicate] (4 个回答) 已关闭 7 年前。 StackOverFlow问题今天
我有几个 EditText View ,我想在其中设置左侧的图像,而 setCompoundDrawablesWithIntrinsicBounds 似乎不起作用。图形似乎没有改变。 有人知道为什么会
#include using namespace std; int main() { static_assert(is_constructible, int(*)(int,int)>::val
fun sum(a: Int, b: Int) = a + b val x = 1.to(2) 我在找: sum.tupled(x),或者 sum(*x) 当然,以上都不能用 Kotlin 1.1.3
有一个函数: func (first: Int) -> Int -> Bool -> String { return ? } 返回值怎么写?我对上面 func 的返回类型感到很困惑。 最
type foo = A of int * int | B of (int * int) int * int 和 (int * int) 有什么区别?我看到的唯一区别在于模式匹配: let test_
我正在尝试制作一个 slider 游戏。在这个类中,我使用 Graphics 对象 g2 的 drawImage 方法来显示“拼图”的 block 。但在绘制类方法中,我收到此错误:找不到符号方法dr
我试着理解这个表达: static Func isOdd = i => (i & 1) == 1; 但是这是什么意思呢? 例如我有 i = 3。然后 (3 & 1) == 1 或 i = 4。然后
我是一名优秀的程序员,十分优秀!