gpt4 book ai didi

python - 在 Pandas Dataframe Cell 中查找特定格式

转载 作者:行者123 更新时间:2023-12-02 19:41:27 25 4
gpt4 key购买 nike

我有一个数据框,需要检查列中每个单元格中的内容是否遵循特定格式。

Index    Column A
0 abcd
1 abc_1
2 abc_xy
3 abc_12
4 zabc_12

如何查找与格式“abc_ + number”匹配的单元格,以便找到索引 1 和 3 中的值。
到目前为止,我知道如何使用正则表达式查找单元格的“abc_”或数字部分:

re.match('abc_', df['Column A'])

但我不知道如何寻找完整的模式。任何帮助将不胜感激,谢谢!

最佳答案

您可以使用Series.str.contains :

df['Column A'].str.contains(r'^abc_\d')

或者,该模式是否应该匹配整个字符串

df['Column A'].str.contains(r'^abc_\d+$')

请注意,默认情况下,pat 参数被视为正则表达式,因此您不必使用 regex=True。您可以使用 na 参数来定义缺失值的填充值。

图案详细信息

  • ^ - 字符串开头(这里需要它,因为 str.contains 使用 re.search,而不是 re.match 因此不会将匹配锚定在字符串的开头)
  • abc_ - 文字子字符串
  • \d+ - 1+ 位数字
  • $ - 字符串结尾。

关于python - 在 Pandas Dataframe Cell 中查找特定格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60073485/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com