python - Pandas df.sum() 只创建 0-6ren

python - Pandas df.sum() 只创建 0

转载作者：太空宇宙更新时间：2023-11-03 13:06:40

27

4

我有大量的 df 信息，我想在其中添加“总计”列。但是，当我使用 sum() 方法时，结果列中只填充了 0 个值。

这是我的 df 的一部分:

    COL NAME0  COL NAME1  COL NAME2  COL NAME3  COL NAME4
0     Alabama   4.099099   4.090001   2.042345   NaN
1      Alaska   1.396396   1.390001   1.000000   1.000000
2     Arizona   4.189189   NaN        2.003257   1.537777
3    Arkansas   2.927928   2.920001   2.208723   NaN
4  California   3.378378   3.780001   1.754930   2.012395

要添加 Total 列，我执行了以下操作:

df['Total'] = df.sum(axis=1)

它创建了以下 df:

    COL NAME0  COL NAME1  COL NAME2  COL NAME3  COL NAME4  Total
0     Alabama   4.099099   4.090001   2.042345   NaN        0.0
1      Alaska   1.396396   1.390001   1.000000   1.000000   0.0
2     Arizona   4.189189   NaN        2.003257   1.537777   0.0
3    Arkansas   2.927928   2.920001   2.208723   NaN        0.0
4  California   3.378378   3.780001   1.754930   2.012395   0.0

然后我尝试了一种不同的方法，将每一列一次添加到 Total 列:

for col in df:
    df['Total'] = df['Total'] + df[col]

但是，这会导致 Total 列仅填充有 NaN 值。

我的猜测是 df 中现有的 NaN 值导致了 Total 列中的这种行为。这似乎是一项简单的任务，所以如果有什么我忽略了，请告诉我。任何建议/解决方案将不胜感激。

最佳答案

我建议用字符串过滤掉第一列并将所有其他列转换为 float :

df['Total'] = df.iloc[:, 1:].astype(float).sum(axis=1)

print (df.dtypes)
COL NAME0    object
COL NAME1    object
COL NAME2    object
COL NAME3    object
COL NAME4    object
dtype: object

df['Total'] = df.sum(axis=1)
print (df)
    COL NAME0 COL NAME1 COL NAME2 COL NAME3 COL NAME4  Total
0     Alabama  4.099099  4.090001  2.042345       NaN    0.0
1      Alaska  1.396396  1.390001  1.000000  1.000000    0.0
2     Arizona  4.189189       NaN  2.003257  1.537777    0.0
3    Arkansas  2.927928  2.920001  2.208723       NaN    0.0
4  California  3.378378  3.780001  1.754930  2.012395    0.0

df['Total'] = df.iloc[:, 1:].astype(float).sum(axis=1)
print (df)
    COL NAME0 COL NAME1 COL NAME2 COL NAME3 COL NAME4      Total
0     Alabama  4.099099  4.090001  2.042345       NaN  10.231445
1      Alaska  1.396396  1.390001  1.000000  1.000000   4.786397
2     Arizona  4.189189       NaN  2.003257  1.537777   7.730223
3    Arkansas  2.927928  2.920001  2.208723       NaN   8.056652
4  California  3.378378  3.780001  1.754930  2.012395  10.925704

如果以后需要处理列:

df =  df.astype(dict.fromkeys(df.columns[1:], 'float'))
print (df.dtypes)
COL NAME0     object
COL NAME1    float64
COL NAME2    float64
COL NAME3    float64
COL NAME4    float64
dtype: object


df['Total'] = df.sum(axis=1)
print (df)
    COL NAME0  COL NAME1  COL NAME2  COL NAME3  COL NAME4      Total
0     Alabama   4.099099   4.090001   2.042345        NaN  10.231445
1      Alaska   1.396396   1.390001   1.000000   1.000000   4.786397
2     Arizona   4.189189        NaN   2.003257   1.537777   7.730223
3    Arkansas   2.927928   2.920001   2.208723        NaN   8.056652
4  California   3.378378   3.780001   1.754930   2.012395  10.925704

关于python - Pandas df.sum() 只创建 0，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57327920/

27

4

0

文章推荐： python - 如何分隔 'di' 单词中的前缀？

文章推荐： python - 如何添加描述性字符串以断言

c++ - Eigen sum()、colwise().sum().sum() 和 rowwise().sum().sum() 都给出了不同的答案
我有这个示例代码: #include #include int main() { Eigen::MatrixXf M = Eigen::MatrixXf::Random(1000, 1000)
sum - 当 sum() 一列时，我收到此错误 AttributeError : 'DataFrame' object has no attribute 'sum'
我有一个像这样的数据框: +-----+--------+ |count| country| +-----+--------+ | 12| Ireland| | 5|Thailand| +-
带条件的字段的 MySQL SUM，IF(SUM(bill_1) IS NULL, '99' , SUM(bill_1)) AS tot_bill_1
我想要 SUM(tot_bill_1+tot_bill_2) AS 总计，但这不起作用 SELECT *, IF(SUM(bill_1) IS NULL, '99', SUM(bill_1)) AS
performance - matlab sum(X-Y) vs sum(X) - sum(Y)
如果我们有两个矩阵 X 和 Y，都是二维的，现在在数学上我们可以说:sum(X-Y)=sum(X)-总和(Y). Matlab 哪个效率更高？哪个更快？最佳答案在我的机器上，sum(x-y) 对于
sql - 为什么 SUM(a + b) != SUM(a) + SUM(b) 在 Hive 中？
我正在运行 Hive 1.1.0 并看到对于两个 bigint 列，active_users 和 inactive_users，SUM(active_users + inactive_users) <
Mysql SUM 的 SUM
是否可以在一个选择查询中求和？类似这样的事情: SELECT id, SUM(current_price - bought_price)*amount AS profit FROM purchase
sql - 为什么 SUM(COL1 + COL2) 和 SUM(COL1) + SUM(COL2) 会产生不同的结果？
这是一个相当奇怪的结果。我希望这些具有相同的产量。下面还有从数据库中提取的 excel 链接。 https://twentius.opendrive.com/files?89038281_muoyg
tsql - 在 TSQL 中，SUM(A + B) 与 SUM(A) + SUM(B) 之间是否存在性能差异？
我必须对 2 个字段求和，然后再求和。从性能的角度来看，先添加字段还是在对列求和之后添加字段有什么区别？方法 1 = SELECT SUM(columnA + columnB) 方法 2 = SEL
arrays - 在这些条件下，是否有可能比 O(n^2) 更好地执行 3-sum/4-sum...k-sum？ - 技术面试
这是一个经典问题，但我很好奇是否有可能在这些条件下做得更好。问题:假设我们有一个长度为4*N的排序数组，即每个元素重复4次。请注意，N 可以是任何自然数。此外，数组中的每个元素都受制于 0 A. 执
sum - PIG : sum and division, 创建对象
我正在编写一个 Pig 程序，该程序加载一个用制表符分隔整个文件的文件例如:名称 TAB 年份 TAB 计数 TAB... file = LOAD 'file.csv' USING PigStora
sql-server - SUM 一列然后减去另一列的 SUM
我有一个包含以下字段的表: EmpID, Code, Amount, TransDate, CM, CMDate 我想要进入数据网格的是 SUM所有的Amount具有相同的 Code和 SUM CM具
php - 在一个查询中显示月 SUM 和年 SUM
我有两个单独的查询用于提取报告信息。一年效果很好。但是，如果一个月超过 1 年，则不会显示正确的响应。这是我的两个查询: select SUM(rpt_complete.total) total,
MySQL SUM(列) + (SUBQUERY WITH SUM)
我想查询一个团队的积分。通过在列上执行 SUM + 来自具有相同团队 ID 的另一个表的 SUM 来添加这些点。我试着这样写: SELECT k.id, s.fylke, s.
mysql - SUM - 为什么我在使用 sum 和使用计算器时得到不同的总和)？
这个问题在这里已经有了答案: How to deal with floating point number precision in JavaScript? (47 个回答) Unexpected
algorithm - 为什么 sum(x/y)/n 不等于 sum(x)/sum(y) 其中 x 和 y 是 n 个正整数的向量？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 5 年前。 Improve
SQL Sum of last X Sum of records
我已经找了一段时间，但找不到这个问题的答案(也许我没有搜索正确的术语或其他东西)。基本上，我有一个数据库，每个日期有任意数量的条目。我需要取包含条目的最后 X 天的总和(忽略没有条目的天数)。我知道如
google-sheets - 在谷歌电子表格查询中使用 sum 会导致许多单元格中的单词 "sum"
我正在尝试获取 B 行中包含 A 行中某个值的所有值中的一些值。我猜这个问题很简单。这是我的查询: =QUERY('Sheet1'!$A$16:D, "Select sum(D) Where C c
mysql - SQL 查询语法错误 : unexpected 'SUM' (sum)
我正在尝试运行以下查询，但出现以下错误: You have an error in your SQL syntax; check the manual that corresponds to your
php - MySQL 中的行明智 SUM 与列明智 SUM
我有一个 tableA，其中包含以下结构我将此结构修改为如下所示的tableB，以减少行数，并且类别是固定长度的假设我在 tableA 中修改为新结构后有 210 万条数据，tableB 仅包含
sql - 每行的 SUM 和过滤结果 SUM IN $x
我的表在 Postgres 中的数据: id user_id sell_amount sell_currency_id buy_amount buy_currency_id type

首页

博学

6Ren·AI

商城

python - Pandas df.sum() 只创建 0