gpt4 book ai didi

python - 通过多个字符串选择 pandas 列

转载 作者:太空宇宙 更新时间:2023-11-03 16:16:26 24 4
gpt4 key购买 nike

我尝试通过特定的部分字符串选择数据帧的几行。

下面的数据框是原始示例数据:

CODE        DATA 
AA2016 47518
BB2016 47518
CC2014 47518
AA2014 47518
EE2015 47518
BB2015 47518
FF2016 47518
AA2013 47518

我想选择Code列中前两个单词所在的行。

例如,我想选择“代码”列中包含“AA”、“BB”、“CC”的行。

结果应如下所示:

enter image description here

我使用这样的代码:

Select_list = ["AA","BB", "CC"]

df = pd.read_clipboard()
df1 = df[df.CODE.str[0:2] isin Select_list]

但是会出现错误,如 SyntaxError: invalid syntax

最佳答案

正如 @ayhan 在评论中指出的那样,您可以使用 df[df.CODE.str[0:2].isin(Select_list)] .

或者,请注意,您可以通过 pd.Series.str.contains 使用正则表达式:

In [6]: df = pd.DataFrame({'CODE': ['AA2016', 'BB2015', 'AB2015']})

In [7]: df.CODE.str.contains(r'AA.*|BB.*|CC.*')
Out[7]:
0 True
1 True
2 False
Name: CODE, dtype: bool

(不过,对于这种特定模式,切片可能更简单。)

关于python - 通过多个字符串选择 pandas 列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38922632/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com