gpt4 book ai didi

python - 有没有办法提高循环速度,或者在不使用 for 循环的情况下以更快的方式做同样的事情?

转载 作者:行者123 更新时间:2023-11-30 22:39:44 24 4
gpt4 key购买 nike

我有一个巨大的数据框(400 万行和 25 列)。我正在尝试调查 2 个分类列。其中一个有大约 5000 个级别 (app_id),另一个有 50 个级别 (app_category)。

我发现对于 app_id 中的每个级别,app_category 都有一个唯一的值。我如何编写代码来证明这一点?

我尝试过这样的事情:

app_id_unique = list(train['app_id'].unique())

for unique in app_id_unique:
train.loc[train['app_id'] == unique].app_category.nunique()

这段代码需要很长时间。

最佳答案

我认为你需要groupbynunique :

train.groupby('app_id').app_category.nunique()

关于python - 有没有办法提高循环速度,或者在不使用 for 循环的情况下以更快的方式做同样的事情?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43053165/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com