gpt4 book ai didi

python - Pandas 表,在重复数据删除的列值上运行 .apply()

转载 作者:行者123 更新时间:2023-12-01 05:43:12 24 4
gpt4 key购买 nike

您好,我在 pandas 中有一个表(请参阅屏幕截图以获取其摘录 - 它有更多行),并希望提取唯一的“author_id”,然后运行一个函数来提取与每个 ID 关联的详细信息。

我通过以下方式提取唯一 ID 列表:

unique_ids = df['author_id'].unique()

然后我尝试运行:

df['author_id'].unique().apply(some_function)

其中“some_function”采用“author_id”并返回一些信息。但我收到错误:

AttributeError: 'numpy.ndarray' object has no attribute 'apply'

所以我求助于:

[some_function(author_id) for author_id in unique_ids]

这可行,但不是执行此操作的有效/矢量化方式。

以矢量化方式执行此操作的方法是什么?

提前致谢! enter image description here

最佳答案

unique函数的输出是一个numpy数组,它不提供apply方法。您可以通过该数组创建一个Series,然后应用您的函数:

pd.Series(df['author_id'].unique()).apply(some_function)

关于python - Pandas 表,在重复数据删除的列值上运行 .apply(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16937332/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com