gpt4 book ai didi

python - 在 pandas DataFrame 中快速应用字符串操作

转载 作者:太空狗 更新时间:2023-10-29 18:18:48 24 4
gpt4 key购买 nike

假设我有一个 DataFrame,它有 10 万行和一列 name。我想尽可能有效地将这个名字分成名字和姓氏。我目前的方法是,

def splitName(name):
return pandas.Series(name.split()[0:2])

df[['first', 'last']] = df.apply(lambda x: splitName(x['name']), axis=1)

不幸的是,DataFrame.apply 真的非常慢。我能做些什么来使这个字符串操作几乎和 numpy 操作一样快吗?

谢谢!

最佳答案

尝试(需要 pandas >= 0.8.1):

splits = x['name'].split()
df['first'] = splits.str[0]
df['last'] = splits.str[1]

关于python - 在 pandas DataFrame 中快速应用字符串操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12829428/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com