gpt4 book ai didi

python - 一些 python/numpy 优化可能吗?

转载 作者:行者123 更新时间:2023-11-28 17:44:47 24 4
gpt4 key购买 nike

我正在分析一些带有嵌套循环的遗传算法代码,据我所知,大部分时间都花在了我的两个函数上,这两个函数涉及对 numpy 数组进行切片和相加。我尽力进一步优化它们,但想看看其他人是否提出了想法。

功能一:

第一个函数被调用了 2954684 次,函数内部花费的总时间为 19 秒

我们基本上只是根据 data[1] 中包含的坐标在 data[0] 中包含的 numpy 数组中创建 View

def get_signal(data, options):
#data[0] contains bed, data[1] contains position
#forward = 0, reverse = 1
start = data[1][0] - options.halfwinwidth
end = data[1][0] + options.halfwinwidth
if data[1][1] == 0:
normals_forward = data[0]['normals_forward'][start:end]
normals_reverse = data[0]['normals_reverse'][start:end]
else:
normals_forward = data[0]['normals_reverse'][end - 1:start - 1: -1]
normals_reverse = data[0]['normals_forward'][end - 1:start - 1: -1]

row = {'normals_forward': normals_forward,
'normals_reverse': normals_reverse,
}
return row

功能二:

调用 857 次,在函数内花费的总时间为 13.674 秒:

signal 是等长的 numpy 数组列表,dtype float,options 只是随机选项

该函数的目标只是将每个numpy数组的列表相加为一个,计算正向和反向数组形成的两条曲线的交点并返回结果

def calculate_signal(signal, options):

profile_normals_forward = np.zeros(options.halfwinwidth * 2, dtype='f')
profile_normals_reverse = np.zeros(options.halfwinwidth * 2, dtype='f')

#here i tried np.sum over axis = 0, its significantly slower than the for loop approach
for b in signal:
profile_normals_forward += b['normals_forward']
profile_normals_reverse += b['normals_reverse']

count = len(signal)

if options.normalize == 1:
#print "Normalizing to max counts"
profile_normals_forward /= max(profile_normals_forward)
profile_normals_reverse /= max(profile_normals_reverse)
elif options.normalize == 2:
#print "Normalizing to number of elements"
profile_normals_forward /= count
profile_normals_reverse /= count

intersection_signal = np.fmin(profile_normals_forward, profile_normals_reverse)
intersection = np.sum(intersection_signal)

results = {"intersection": intersection,
"profile_normals_forward": profile_normals_forward,
"profile_normals_reverse": profile_normals_reverse,
}
return results

如您所见,这两个非常简单,但在一个可以运行数小时/数天(遗传算法优化)的脚本上占我执行时间的 > 60%,因此欢迎进行微小的改进:)

最佳答案

为了提高第一个函数的速度,我会做的一件简单的事情是使用不同的符号来访问列表索引,详见 here .

例如:

foo = numpyArray[1][0] 
bar = numpyArray[1,0]

第二行将执行得更快,因为您不必返回 numpyArray[1] 处的整个元素,然后找到其中的第一个元素。试试看

关于python - 一些 python/numpy 优化可能吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20055067/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com