gpt4 book ai didi

python - Pandas 数据框中的错误过滤列表

转载 作者:行者123 更新时间:2023-11-28 22:37:13 25 4
gpt4 key购买 nike

通常,一个 pandas Dataframe 的过滤方式如下:

import pandas as pd
df = pd.read_csv(...)
df_filtered = df[df['column'] == value]

我有以下数据框df1:

numbers    letters   other_columns
0 [A] ....
1 [A] ....
2 [C] ....
3 [B] ....
4 [B] ....
5 [A] ....
... ....

我以为 letters 中的条目是字符串,但这些实际上是列表:

type(df1.letters.ix[0]) 

输出列表

因此,我尝试将数据框 df1 过滤为只有 [A] 行。

那是 only_A 应该是这样的:

numbers    letters   other_columns
0 [A] ....
1 [A] ....
5 [A] ....
... ....

但是,如果我尝试使用代码进行过滤

only_A = df1[df1['letters'] == list('A')]

我得到一个错误,ValueError

ValueError: Arrays were different lengths: 3076 vs 1

过滤此数据框的正确方法是什么?

最佳答案

您可以使用 Series.str.join 在不更改 DataFrame 的情况下进行过滤。

df[df['letters'].str.join('') == 'A']

关于python - Pandas 数据框中的错误过滤列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36755507/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com