gpt4 book ai didi

python - Pandas :替换函数语法

转载 作者:太空狗 更新时间:2023-10-30 02:39:53 30 4
gpt4 key购买 nike

我有一个巨大的 DataFrame,其中有一列包含名称列表。名称附有数字和括号。我正在尝试将它们从名称中删除。我发现适用于此的方法是:

df.Name = df.Name.str.replace(r'[\(\)\d]+', '')

有人可以帮我理解替换函数中的语法吗?

(r'[\(\)\d]+', '')

最佳答案

Could someone please help me to understand the syntax inside the replace function?

您看到的是一个正则表达式。正则表达式有一种特殊的语法来指定模式

在此正则表达式中,[...] 表示一个字符组。这里的字符组由\((左括号)、\)(右括号)和\d(数字)填充。

末尾的 + 表示一个或多个 所以我们指定模式由字符组中字符的序列。所以像 '142(2' 这样的字符串将匹配正则表达式。

您将字符串中与该模式匹配的所有子字符串替换为空字符串,因此您删除它们。

构建、测试和修复正则表达式的有用工具是 regex101 .如果您点击链接,您可以指定一个正则表达式并查看哪些字符串与所描述的模式相匹配。右侧有一个面板,旨在用自然语言解释模式的作用。

此外还有这个regex visualizer显示正则表达式的结构:

visualization of the regex

如果您可以沿着铁路到达目的地,则子串“匹配”,因此只要有左括号、右括号或数字,我们就可以在灰色框中继续循环,直到我们决定点击完成。

关于python - Pandas :替换函数语法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43162039/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com