gpt4 book ai didi

python - 使用多个内核同时处理多个数据文件

转载 作者:太空宇宙 更新时间:2023-11-03 15:46:48 24 4
gpt4 key购买 nike

我有多个使用 python Pandas 库处理的数据文件。每个文件都是一一处理的,看任务管理器只用了一个逻辑处理器(大约在95%左右,其余的都在5%以内)

有没有办法同时处理数据文件?如果是这样,有没有办法利用其他逻辑处理器来做到这一点?

(欢迎修改)

最佳答案

如果您的文件名在列表中,您可以使用以下代码:

from multiprocessing import Process

def YourCode(filename, otherdata):
# Do your stuff

if __name__ == '__main__':
#Post process files in parallel
ListOfFilenames = ['file1','file2', ..., 'file1000']
ListOfProcesses = []
Processors = 20 # n of processors you want to use
#Divide the list of files in 'n of processors' Parts
Parts = [ListOfFilenames[i:i + Processors] for i in xrange(0, len(ListOfFilenames), Processors)]

for part in Parts:
for f in part:
p = multiprocessing.Process(target=YourCode, args=(f, otherdata))
p.start()
ListOfProcesses.append(p)
for p in ListOfProcesses:
p.join()

关于python - 使用多个内核同时处理多个数据文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41680701/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com