gpt4 book ai didi

python - 在某个单词的 Pandas 数据框列中拆分文本

转载 作者:太空宇宙 更新时间:2023-11-04 00:03:46 24 4
gpt4 key购买 nike

我想在单词“at”处拆分列中的文本

这是我的 df:

Job       
Operation Manager at Barclays
Chief Operating Officer at Llyods

它实际上有数千个单元格长,但那只是一个快照。

这就是我想要的:

Job                      Location
Operating Manager Barclays
Chief Operating Officer Llyods

这是我尝试过的:

df2 = pd.DataFrame(df.Job.str.split('at',1).tolist(), columns = ['Job','Location'])

这是我得到的(不是我想要的):

Job               Location
Oper ating Manager at Barclays
Chief Oper ating Officer at Llyods

所以它在“at”处拆分,但在第一个单词中它遇到了字符串“at”。我希望它在“at”这个词处 split 。有办法做到这一点吗?

我已经尝试了以下但它不起作用:

df2 = pd.DataFrame(df.Job.str.split(' at ',1).tolist(), columns = ['Job','Location'])

我明白了:

Job                                     Location
Operating Manager at Barclays None
Chief Operating Officer at Llyods None

最佳答案

使用 str.split(r"\bat\b", expand=True)

例如:

import pandas as pd

df = pd.DataFrame({"Job": ["Operation Manager at Barclays", "Chief Operating Officer at Llyods"]})
df[["Job", "Location"]] = df["Job"].str.split(r"\bat\b", expand=True)
print(df)

输出:

                        Job   Location
0 Operation Manager Barclays
1 Chief Operating Officer Llyods

关于python - 在某个单词的 Pandas 数据框列中拆分文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54903853/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com