gpt4 book ai didi

python - 无论长度如何,Pandas Dataframe 上最干净的迭代/功能应用程序

转载 作者:行者123 更新时间:2023-11-28 16:34:13 30 4
gpt4 key购买 nike

我一直在努力将函数干净地迭代或应用到可变长度的 Pandas DataFrame。具体来说,长度为 1 的 DataFrame 切片(Pandas 系列)。

简单示例,一个 DataFrame 和一个作用于其中每一行的函数。数据帧的格式是已知的/预期的。

def stringify(row):
return "-".join([row["y"], str(row["x"]), str(row["z"])])

df = pd.DataFrame(dict(x=[1,2,3],y=["foo","bar","bro"],z=[-99,1.04,213]))
Out[600]:
x y z
0 1 foo -99.00
1 2 bar 1.04
2 3 bro 213.00

df_slice = df.iloc[0] # This is a Series

通常,您可以通过以下方式之一应用该功能:

stringy = df.apply(stringify,axis=1)
# or
stringy = [stringify(row) for _,row in df.iterrows()]

Out[611]: ['foo-1--99.0', 'bar-2-1.04', 'bro-3-213.0']

## Error with same syntax if Series
stringy = df_slice.apply(stringify, axis=1)

如果数据框为空,或只有一个条目,这些方法将不再有效。 Series 没有 iterrows() 方法,apply 将该函数应用于每一列(而非行)。

是否有更简洁的内置方法来迭代/将函数应用于可变长度的数据帧?否则你必须不断地编写繁琐的逻辑。

if type(df) is pd.DataFrame:
if len(df) == 0:
return None
else:
return df.apply(stringify, axis=1)
elif type(df) is pd.Series:
return stringify(df)

我知道有一些方法可以确保您形成长度为 1 的 DataFrame,但我要问的是一种干净的方法来应用/迭代各种 pandas 数据结构,当它可能是类似格式的数据帧或系列时。

最佳答案

没有通用的方法来编写一个函数来无缝地处理这两个问题数据框和系列。您可能需要使用 if 语句 来检查对于类型,或者使用 try..except 来处理异常。

我认为最好在调用 apply 之前确保创建正确类型的对象,而不是做这些事情。例如,不使用返回系列的 df.iloc[0],而是使用 df.iloc[:1] 选择一个 DataFrame长度为 1。只要将切片 range 而不是单个值传递给 df.iloc,就会返回一个 DataFrame。

In [155]: df.iloc[0]
Out[155]:
x 1
y foo
z -99
Name: 0, dtype: object

In [156]: df.iloc[:1]
Out[156]:
x y z
0 1 foo -99

关于python - 无论长度如何,Pandas Dataframe 上最干净的迭代/功能应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28774914/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com