python - Pandas 虫？ : Mean of an grouped-by int64 column stays as int64 in some circumstances-6ren

python - Pandas 虫？ : Mean of an grouped-by int64 column stays as int64 in some circumstances

转载作者：太空狗更新时间：2023-10-30 01:28:20

26

4

我发现一个非常奇怪的(恕我直言)行为，一些数据从 CSV 文件加载到 pandas 中。为了保护无辜者，让我们声明 DataFrame 位于变量 homes 中，并且除其他外，具有以下列:

In [143]: homes[['zipcode', 'sqft', 'price']].dtypes
Out[143]:
zipcode     int64
sqft        int64
price       int64
dtype: object

为了获得每个邮政编码的平均价格，我尝试了:

In [146]: homes.groupby('zipcode')[['price']].mean().head(n=5)
Out[146]:
           price
zipcode
28001     280804
28002     234284
28003     294111
28004    1355927
28005     810164

奇怪的是，价格平均值是一个 int64，如下所示:

In [147]: homes.groupby('zipcode')[['price']].mean().dtypes
Out[147]:
price    int64
dtype: object

我无法想象为什么某些整数的平均值没有提升为 float 的任何技术原因。更重要的是，只需添加另一列，价格就会变成 float64正如我所期望的那样:

In [148]: homes.groupby('zipcode')[['price', 'sqft']].mean().dtypes
Out[148]:
price       float64
sqft        float64
dtype: object

                  price          sqft
zipcode
28001     280804.690608  14937.450276
28002     234284.035176   7517.633166
28003     294111.278571  10603.096429
28004    1355927.097792  13104.220820
28005     810164.880952  19928.785714

为了确保我没有遗漏一些非常明显的东西，我创建了另一个非常简单的 DataFrame (df) 但是，对于这个，这个行为没有出现:

In [161]: df[['J','K']].dtypes
Out[161]:
J    int64
K    int64
dtype: object

In [164]: df[['J','K']].head(n=10)
Out[164]:
   J   K
0  0  -9
1  0 -14
2  0   8
3  0 -11
4  0  -7
5 -1   7
6  0   2
7  0   0
8  0   5
9  0   3

In [165]: df.groupby('J')[['K']].mean()
Out[165]:
           K
J
-2 -2.333333
-1  0.466667
 0 -1.030303
 1 -1.750000
 2 -3.000000

请注意，对于单列 K:int64，按 J 分组，另一个 int64，均值直接是 float 。 homes DataFrame 是从一个提供的 CSV 文件，df 文件是在 pandas 中创建的，写入 CSV 文件然后读回。

最后但同样重要的是，我使用的是 pandas 0.16.2。

最佳答案

正如你们中的一些人在评论中所建议的那样，这是 pandas 中的一个错误。我刚举报了here .

截至目前，它已被pandas团队接受。

谢谢

关于python - Pandas 虫？ : Mean of an grouped-by int64 column stays as int64 in some circumstances，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32809182/

26

4

0

文章推荐： Python scikit 学习 n_jobs

文章推荐： c# - 如何将 Linq2SQL 集合数据绑定(bind)到 winform 文本字段

文章推荐： c# - 图像列表/图像内存不足异常

文章推荐： python - 在 FFT 中没有加速的情况下增加了占用率

长连接Netty服务内存泄漏，看我如何一步步捉“虫”解决
作者：京东科技王长春背景事情要回顾到双11.11备战前夕，在那个风雨交加的夜晚，一个急促的咚咚报警，惊破了电闪雷鸣的黑夜，将沉浸在梦香，熟睡的我惊醒。一看手机咚咚报警，不好
objective-c - 奇怪的 cocoa 虫？
嘿伙计们，下面是我用于学校作业的一段代码。每当我输入一个带有 O 的单词(大写 o)时，它都会失败!每当这个程序中有一个或多个大写 O 时，它就会返回 false 并记录:句子不是回文。对于那些不知
postgresql - 虫 : pq duplicate key violates unique constraint
我目前正在努力学习 go & Gorm，所以如果我遗漏了一些明显的东西，我深表歉意。我已经声明了以下 GORM 模型 type User struct { gorm.Model Di
javascript - Karma 在 Chrome 中打开了 3 次。 karma 虫？
出于某种原因，Karma 尝试了 3 次打开 Chrome，并认为没有成功。加载后它工作正常，并显示它连接在两个套接字上。我将 Chrome 安装在与 Karma 默认位置不同的位置，因此我必须链接
python - Pandas 虫？ : Mean of an grouped-by int64 column stays as int64 in some circumstances
我发现一个非常奇怪的(恕我直言)行为，一些数据从 CSV 文件加载到 pandas 中。为了保护无辜者，让我们声明 DataFrame 位于变量 homes 中，并且除其他外，具有以下列: In [1

首页

博学

6Ren·AI

商城

python - Pandas 虫？ : Mean of an grouped-by int64 column stays as int64 in some circumstances