gpt4 book ai didi

python - 根据指定列中的字符串值条目是否包含子字符串来分隔 pandas 数据框

转载 作者:行者123 更新时间:2023-12-02 02:47:56 25 4
gpt4 key购买 nike

假设我有以下数据框:

df = pd.DataFrame({'name':['a', 'b', 'c','d','e'], 'description':['vim2tests','vim2trial','vim3tests','vim3zip', 'vim4trial'], 'count':[4,5,6,7,8]})

我试图分成 3 个数据帧,其中包含“描述”条目包含“vim2”、“vim3”、“vim4”子字符串的行。

有没有有效的方法来做到这一点?我可以实现一个 for 循环来查找我想要的行的索引,但这根本没有效率,我正在努力寻找更好的方法。

最佳答案

IIUC,只需使用 str.extract 创建一个 groupby 条件列

我们可以将数据帧保存在字典中。

dfs = {group : data.drop('key',1) for group,data in 
df.assign(key=df['description'].str.extract('(vim\d+)'))\
.groupby('key')
}

print(dfs['vim3'])
name description count
2 c vim3tests 6
3 d vim3zip 7

print(dfs.keys())

dict_keys(['vim2', 'vim3', 'vim4'])

或者 anky 提供的更简单的解决方案 -

dfs = dict(tuple(
df.groupby(df['description'].str.extract('(vim\d+)'
,expand=False))
))

或者:

dict(iter(df.groupby(df['description'].str.extract('(vim\d+)',expand=False)))

print(dfs)

{'vim2': name description count
0 a vim2tests 4
1 b vim2trial 5,
'vim3': name description count
2 c vim3tests 6
3 d vim3zip 7,
'vim4': name description count
4 e vim4trial 8}

关于python - 根据指定列中的字符串值条目是否包含子字符串来分隔 pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62489297/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com