gpt4 book ai didi

python - 如何纠正 pandas 数据框中的拼写错误

转载 作者:太空宇宙 更新时间:2023-11-03 17:54:19 26 4
gpt4 key购买 nike

我有一个像这样的 pandas 数据框

    a      b    c
1 "hi" 1 2
2 "hi" 4 1
3 "Hi" 1 3
4 "hi" 2 1
5 "Hi" 2 1

所有“Hi”都应该更正为“hi”,我怎么能用 pandas 干净地在此之前

这是一个玩具示例,实际数据可以更大

最佳答案

如果你想让它变成小写,你可以这样做 -

df['a'] = df['a'].str.lower()

如果您想替换某些单词 -

df['a'] = df['a'].str.replace('Hi', 'hi')

或者,如果该单词出现在短语中,请使用正则表达式 -

df['a'] = df['a'].str.replace('\bHi\b', 'hi')

此正则表达式选项允许您甚至使用单词 -

In [12]: df
Out[12]:
a b
0 hi 1
1 hi 2
2 Hi mom 3
3 mom Hi, mom 4
4 mHim Hi 5

In [13]: df['a'] = df.a.str.replace(r'\bHi\b', 'hi')

In [14]: df
Out[14]:
a b
0 hi 1
1 hi 2
2 hi mom 3
3 mom hi, mom 4
4 mHim hi 5

请注意,所有单词“Hi”都被替换为“hi”,但在最后一个示例中,“Hi”出现在单词中间,因此替换并未完成。

关于python - 如何纠正 pandas 数据框中的拼写错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28706968/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com