gpt4 book ai didi

python - 使用 Pandas 数据帧时如何避免慢速 for() : loops,?

转载 作者:太空宇宙 更新时间:2023-11-04 10:06:45 26 4
gpt4 key购买 nike

for i in range( 1, len( df ) ):
if df.loc[i]["identification"] == df.loc[i-1]["identification"] and df.loc[i]["date"] == df.loc[i-1]["date"]:
df.loc[i,"duplicate"] = 1
else:
df.loc[i,"duplicate"] = 0

在处理大数据帧时,这个简单的 for 循环运行起来非常慢。

有什么建议吗?

最佳答案

尝试使用向量化方法而不是循环:

df['duplicate'] = np.where((df.identification == df.identification.shift())
&
(df.date == df.date.shift()),
1,0)

关于python - 使用 Pandas 数据帧时如何避免慢速 for() : loops,?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40619429/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com