gpt4 book ai didi

python-3.x - 如何通过/nlargest 计算获取 Pandas 组中的其他列名信息?

转载 作者:行者123 更新时间:2023-12-04 09:43:47 25 4
gpt4 key购买 nike

我正在使用六个 fuzzywuzzy 比较字符串对比率,我需要输出每对的前三个分数。

这条线做的工作:

final2_df = final_df[['nameHiringOrganization', 'mesure', 'name', 'valeur']].groupby(['nameHiringOrganization', 'name'])['valeur'].nlargest(3)

但是,excel 输出表缺少包含比率名称的“测量”列。这很烦人,因为那样我就无法确定六个比率中的哪一个最适合任何给定的对。

我认为在开始时选择列可能会起作用(final_df[['columns', ...]]),但似乎不起作用。

关于如何添加该信息的任何想法?

提前谢谢了!

最佳答案

我认为这里可以使用另一种解决方案,使用 DataFrame.sort_values 按 3 列排序然后使用 GroupBy.head :

final2_df = (final_df.sort_values(['nameHiringOrganization', 'name', 'valeur'], 
ascending=[True, True, False])
.groupby(['nameHiringOrganization', 'name'])
.head(3))

关于python-3.x - 如何通过/nlargest 计算获取 Pandas 组中的其他列名信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62210659/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com