gpt4 book ai didi

python - Pandas 数据框创建新列,指示其他列中的重叠值

转载 作者:行者123 更新时间:2023-12-02 01:30:03 24 4
gpt4 key购买 nike

我的数据框如下所示:

df = pd.DataFrame({"ID": [1, 2],
"fields": [["eggs", "apple", "toy", "orange", "bear", "red"],
["orange", "bear", "red"]],
"subfields":[["bear", "red"],["bear", "red"]]})

我的预期输出是:

<表类=“s-表”><标题>ID字段子字段和字段之间重叠 <正文>1鸡蛋N1苹果N1玩具N1橙色N1熊是1红色是2橙色N2熊是2红色是

我能做到这一点吗?非常感谢!

最佳答案

这是一个非常简单的解决方案。

免责声明:如果每个列表中的元素超过 15 个,请忘记我的解决方案。


new_df = df.explode('fields')
new_df['overlap between subfields and fields'] = new_df.apply(
lambda row: row['fields'] in row['subfields'],
axis=1
).replace({True: 'Y', False: 'N'})

new_df.drop(columns='subfields', inplace=True)

关于python - Pandas 数据框创建新列,指示其他列中的重叠值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73542383/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com