gpt4 book ai didi

Python pandas - 提取和替换

转载 作者:行者123 更新时间:2023-12-01 02:26:34 24 4
gpt4 key购买 nike

我有一个 Pandas 数据框列,其中包含类似于字符串 McNally, King (XYZ) 的元素。我想保留姓氏和名字并删除其他所有内容。因此,清理后 McNally, King (XYZ) 应为 McNally, King

我尝试了以下两个函数,但没有得到想要的结果:

df['name'] = df['name'].str.extract(r'\w+\,\s[A-Z][a-z]+', expand=False)

df['name'] = df['name'].replace({r'\w+\,\s[A-Z][a-z]+' : r'\w+\,\s[A-Z][a-z]+'}, regex=True)

第二个代码用正则表达式本身替换子字符串,而第一个代码从字符串中提取名称,但我想保留名称并删除名称后面的所有其他内容。

编辑:样本数据:

Reyes, Rebecca  L (XYZ)
Derry, Odd P (XYZ)
Garza, Per-Laura A (MNP)
Fernandez, Rafael Carl (XYZ)

预期输出:

Reyes, Rebecca
Derry, Odd
Garza, Per-Laura
Fernandez, Rafael

我想就地编辑,即修改现有的数据名本身而不是创建新的数据名。

最佳答案

你可以尝试这样的事情:

df = pd.DataFrame({'name':['McNally, King  (XYZ)']}, index=[0])
df['name'].str.extract(r'(\w+,\s\w+)')

输出:

0    McNally, King
Name: name, dtype: object

关于Python pandas - 提取和替换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47333776/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com