gpt4 book ai didi

python - 尝试替换 pandas 数据框中的停用词,发生 sre_constants.error

转载 作者:行者123 更新时间:2023-12-01 09:22:13 25 4
gpt4 key购买 nike

我在从 pandas 数据框中删除停用词时遇到问题。我的代码是这样的:

for word in stopwords: 
df['name'] = df['name'].str.replace(word, '')

我收到错误:sre_constants.error:在位置 0 处没有可重复的内容。有没有解决该错误的方法,或者有其他方法来替换停用词

最佳答案

尝试使用 regex=True 进行 df.replace:

例如:

import pandas as pd
stopwords = ["AAA", "BBB"]
df = pd.DataFrame({"name": ["Hello", "World", "AAA", "BBB"]})
print( df["name"].replace("|".join(stopwords), "", regex=True))

输出:

0    Hello
1 World
2
3
Name: name, dtype: object

关于python - 尝试替换 pandas 数据框中的停用词,发生 sre_constants.error,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50722880/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com