gpt4 book ai didi

python - 创建名称中带有句点的 Pandas 系列

转载 作者:太空狗 更新时间:2023-10-30 00:43:57 25 4
gpt4 key购买 nike

我运行了以下 Python 代码,它创建了一个包含两个系列(ab)的 Pandas DataFrame,然后尝试创建两个新系列( cd):

import pandas as pd
df = pd.DataFrame({'a':[1, 2, 3], 'b':[4, 5, 6]})
df['c'] = df.a + df.b
df.d = df.a + df.b

我的理解是,如果 Pandas Series 是 DataFrame 的一部分,并且 Series 名称没有任何空格(并且不与现有属性或方法冲突),则可以将 Series 作为 DataFrame 的属性进行访问.因此,我预计第 3 行 会起作用(因为这就是您创建新 Pandas 系列的方式),并且我预计第 4 行 会失败(因为 在执行该行代码之前,DataFrame 不存在 d 属性。

令我惊讶的是,第 4 行没有导致错误。相反,DataFrame 现在包含三个系列:

>>> df
a b c
0 1 4 5
1 2 5 7
2 3 6 9

还有一个新对象,df.d,它是一个 Pandas 系列:

>>> df.d
0 5
1 7
2 9
dtype: int64

>>> type(df.d)
pandas.core.series.Series

我的问题如下:

  • 为什么第 4 行没有导致错误?
  • df.d 现在是具有所有常规系列功能的“普通”Pandas 系列吗?
  • df.d 是否以任何方式“连接”到 df DataFrame,或者它是一个完全独立的对象?

我问这个问题的动机只是想更好地理解 Pandas,而不是因为第 4 行有一个特定的用例。

我的Python版本是2.7.11,我的Pandas版本是0.17.1。

最佳答案

赋值时需要用括号表示,例如df['d'] = ...

d 现在是数据框 df 的属性。与任何对象一样,您可以为它们分配属性。这就是它没有产生错误的原因。它只是没有像您预期的那样运行...

df.some_property = 'What?'
>>> df.some_property
'What?'

这是 Pandas 初学者的一个常见误区。 始终使用括号表示法进行赋值。引用数据框/系列时,点符号是为了方便起见。为了安全起见,您始终可以使用括号表示法。

是的,根据您的示例,df.d 是一个正常系列,现在是数据框的意外属性。该系列是它自己的对象,由您在将其分配给 df 时创建的引用连接。

关于python - 创建名称中带有句点的 Pandas 系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35850290/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com