gpt4 book ai didi

基于 Monte Carlo 的 Pi 计算的 Python 高效矢量化

转载 作者:太空宇宙 更新时间:2023-11-03 14:20:50 24 4
gpt4 key购买 nike

为了近似 Pi 的值,请考虑使用随机值填充数组并测试是否包含单位圆的随机方法,

import random as rd
import numpy as np

def r(_): return rd.random()

def np_pi(n):
v_r = np.vectorize(r)
x = v_r(np.zeros(n))
y = v_r(np.zeros(n))

return sum (x*x + y*y <= 1) * 4. / n

注意随机数生成依赖于 Python 标准库;考虑 numpy 随机生成,

def np_pi(n):
x = np.random.random(n)
y = np.random.random(n)

return sum (x*x + y*y <= 1) * 4. / n

现在考虑非向量化方法,

import random as rd

def dart_board():
x,y = rd.random(), rd.random()
return (x*x + y*y <= 1)

def pi(n):
s = sum([dart_board() for _ in range(n)])
return s * 4. / n

非矢量化形式平均比矢量化形式快 4 倍,例如考虑 n = 5000000 和操作系统命令行如下(Python 2.7、Quadcore、8GB RAM、RedHat Linux) ,

time python pi.py
time python np_pi.py

因此请教如何改进矢量化方法以提高其性能。

最佳答案

您正在调用 python 内置函数 sum,而不是 numpy 的向量化方法 sum:

import numpy as np
import random as rd

def np_pi(n):
x = np.random.random(n)
y = np.random.random(n)

return (x*x + y*y <= 1).sum()

def dart_board():
x,y = rd.random(), rd.random()
return (x*x + y*y <= 1)

def pi(n):
s = sum([dart_board() for _ in range(n)])

计时结果现在大不相同:

In [12]: %timeit np_pi(10000)
1000 loops, best of 3: 250 us per loop

In [13]: %timeit pi(10000)
100 loops, best of 3: 3.54 ms per loop

我猜测在 numpy 数组上调用内置的 sum 会通过遍历数组而不是使用向量化例程导致开销。

关于基于 Monte Carlo 的 Pi 计算的 Python 高效矢量化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28231358/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com