gpt4 book ai didi

Python Pandas - 检查子字符串包含并将新列设置为子字符串

转载 作者:太空宇宙 更新时间:2023-11-04 10:00:38 25 4
gpt4 key购买 nike

我需要检查字符串包含并将新列设置为子字符串值。我目前正在尝试这个

df['NEW_COL'] = df['COL_TO_CHECK'].str.contains('|'.join(substring_list))

而不是为包含返回 bool 值 true false ... 我需要从 substring_list 返回实际值以匹配填充 df['NEW_COL]

要检查的子字符串

substring_list = ['apple', 'banana', 'cherry']

结果数据框

OLD_COL              NEW_COL
apple pie apple
black cherry cherry
banana lemon drop banana

最佳答案

您对您的数据是什么以及您想要什么不是很有洞察力,但一般原则是您可以使用:

df['NEW_COL'] = df['COL_TO_CHECK'].apply(lambda x: do_something(x) if is_something(x) else x)

或者在你的例子中:

substring_list = set(['apple', 'banana', 'cherry'])
df['NEW_COL'] = df['OLD_COL'].apply(lambda x: set(x.split()).intersection(substring_list).pop())

set 更快:)

关于Python Pandas - 检查子字符串包含并将新列设置为子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43802901/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com