- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我发现一个非常奇怪的(恕我直言)行为,一些数据从 CSV 文件加载到 pandas 中。为了保护无辜者,让我们声明 DataFrame
位于变量 homes
中,并且除其他外,具有以下列:
In [143]: homes[['zipcode', 'sqft', 'price']].dtypes
Out[143]:
zipcode int64
sqft int64
price int64
dtype: object
为了获得每个邮政编码的平均价格,我尝试了:
In [146]: homes.groupby('zipcode')[['price']].mean().head(n=5)
Out[146]:
price
zipcode
28001 280804
28002 234284
28003 294111
28004 1355927
28005 810164
奇怪的是,价格平均值是一个 int64,如下所示:
In [147]: homes.groupby('zipcode')[['price']].mean().dtypes
Out[147]:
price int64
dtype: object
我无法想象为什么某些整数的平均值没有提升为 float 的任何技术原因。更重要的是,只需添加另一列,价格就会变成 float64正如我所期望的那样:
In [148]: homes.groupby('zipcode')[['price', 'sqft']].mean().dtypes
Out[148]:
price float64
sqft float64
dtype: object
price sqft
zipcode
28001 280804.690608 14937.450276
28002 234284.035176 7517.633166
28003 294111.278571 10603.096429
28004 1355927.097792 13104.220820
28005 810164.880952 19928.785714
为了确保我没有遗漏一些非常明显的东西,我创建了另一个非常简单的 DataFrame
(df
) 但是,对于这个,这个行为没有出现:
In [161]: df[['J','K']].dtypes
Out[161]:
J int64
K int64
dtype: object
In [164]: df[['J','K']].head(n=10)
Out[164]:
J K
0 0 -9
1 0 -14
2 0 8
3 0 -11
4 0 -7
5 -1 7
6 0 2
7 0 0
8 0 5
9 0 3
In [165]: df.groupby('J')[['K']].mean()
Out[165]:
K
J
-2 -2.333333
-1 0.466667
0 -1.030303
1 -1.750000
2 -3.000000
请注意,对于单列 K:int64,按 J 分组,另一个 int64,均值直接是 float 。 homes
DataFrame
是从一个提供的 CSV 文件,df
文件是在 pandas 中创建的,写入 CSV 文件然后读回。
最后但同样重要的是,我使用的是 pandas 0.16.2。
最佳答案
关于python - Pandas 虫? : Mean of an grouped-by int64 column stays as int64 in some circumstances,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32809182/
作者:京东科技 王长春 背景 事情要回顾到双11.11备战前夕,在那个风雨交加的夜晚,一个急促的咚咚报警,惊破了电闪雷鸣的黑夜,将沉浸在梦香,熟睡的我惊醒。 一看手机咚咚报警,不好
嘿伙计们,下面是我用于学校作业的一段代码。每当我输入一个带有 O 的单词(大写 o)时,它都会失败!每当这个程序中有一个或多个大写 O 时,它就会返回 false 并记录:句子不是回文。 对于那些不知
我目前正在努力学习 go & Gorm,所以如果我遗漏了一些明显的东西,我深表歉意。 我已经声明了以下 GORM 模型 type User struct { gorm.Model Di
出于某种原因,Karma 尝试了 3 次打开 Chrome,并认为没有成功。加载后它工作正常,并显示它连接在两个套接字上。 我将 Chrome 安装在与 Karma 默认位置不同的位置,因此我必须链接
我发现一个非常奇怪的(恕我直言)行为,一些数据从 CSV 文件加载到 pandas 中。为了保护无辜者,让我们声明 DataFrame 位于变量 homes 中,并且除其他外,具有以下列: In [1
我是一名优秀的程序员,十分优秀!