gpt4 book ai didi

python - Pandas,应用函数,它为两行接受两个参数

转载 作者:太空宇宙 更新时间:2023-11-04 11:08:01 25 4
gpt4 key购买 nike

例子如下:

df = pd.DataFrame({
'link': ['link1', 'link1', 'link2', 'link2', 'link3', 'link3'],
'text': ['text1', 'text2', 'text3', 'text4', 'text5', 'text6']
})

我有一个函数(Levenshtein 距离),我可以将其应用于每个唯一链接并获得如下结果:

    link    text
0 link1 text1 text2 function(text1, text2) result
1 link2 text3 text4 function(text1, text2) result
2 link3 text5 text6 function(text1, text2) result

最佳答案

您可以使用函数pivot_table:

df = df.pivot_table(index='link', values='text', aggfunc=[list, 'sum']).reset_index()
df.columns = ['link', 'text', 'result']

输出:

    link            text      result
0 link1 [text1, text2] text1text2
1 link2 [text3, text4] text3text4
2 link3 [text5, text6] text5text6

您需要用您的函数替换我的解决方案中的'sum'

关于python - Pandas,应用函数,它为两行接受两个参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58955310/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com