- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试向 DataFrame 添加一列,指示客户在订单中包含超过 10 件商品的次数。
我的代码目前看起来像:
import pandas as pd
my_data = {'customer_id' : ['101A', '101A', '104B', '102A', '101A', '104B', '102A', '104B', '101A', '102A' ],
'date' : ['20120321','20120201','20120123','20111218','20111209','20111127','20111118','20111012','20111001','20110921'],
'invoice_amt' : [654.76, 234.45, 99.45, 767.63, 124.76, 346.87, 652.65, 765.21, 275.76, 532.21 ],
'no_line_items' : [19, 24, 6, 2, 6, 4, 18, 10, 18, 8]}
data_df = pd.DataFrame(my_data).sort_index(by='date',ascending=True)
计算每个客户每张发票的最大项目数:
data_df['max_line_items'] = data_df.groupby('customer_id')['no_line_items'].transform(lambda x: x.max())
计算出每个客户的发票数量,其中项目大于或等于 10:
data_df['no_vip_invoices'] = data_df.groupby('customer_id')[data_df['no_line_items']>10].transform(lambda x: x.count())
我理想的输出是:
customer_id date invoice_amt no_line_items max_line_items no_vip_invoices
9 102A 20110921 532.21 8 18 1
8 101A 20111001 275.76 18 24 3
7 104B 20111012 765.21 10 10 0
6 102A 20111118 652.65 18 18 1
5 104B 20111127 346.87 4 10 0
4 101A 20111209 124.76 6 24 3
3 102A 20111218 767.63 2 18 1
2 104B 20120123 99.45 6 10 0
1 101A 20120201 234.45 24 24 3
0 101A 20120321 654.76 19 24 3
当前遇到错误
KeyError: 'Columns not found: True'
如有任何帮助,我们将不胜感激
谢谢
V
最佳答案
lambda
这为您提供了所需的输出数据帧:
grouped = data_df.groupby('customer_id')
data_df['max_line_items'] = grouped['no_line_items'].transform(lambda x: x.max())
data_df['no_vip_invoices'] = grouped['no_line_items'].transform(lambda x: len(x[x>10]))
print(data_df.to_string())
输出:
customer_id date invoice_amt no_line_items max_line_items no_vip_invoices
9 102A 20110921 532.21 8 18 1
8 101A 20111001 275.76 18 24 3
7 104B 20111012 765.21 10 10 0
6 102A 20111118 652.65 18 18 1
5 104B 20111127 346.87 4 10 0
4 101A 20111209 124.76 6 24 3
3 102A 20111218 767.63 2 18 1
2 104B 20120123 99.45 6 10 0
1 101A 20120201 234.45 24 24 3
0 101A 20120321 654.76 19 24 3
def
如果您不喜欢或不想使用 lambda
,您可以随时使用普通函数:
def by_max(group):
"""Group by maximum.
"""
return group.max()
def by_len(group):
"""Group by length greater 10.
"""
return len(group[group>10])
data_df['max_line_items'] = grouped['no_line_items'].transform(by_max)
data_df['no_vip_invoices'] = grouped['no_line_items'].transform(by_len)
结果同上。这种方法的一个优点是您可以使用文档字符串。此外,您还可以使用 lambda
无法使用的语句。
关于python - 计算 Pandas 组中满足特定条件的行数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35120607/
我有一个包含未定义条目数的数据文件,如下所示: A B C D E.. 1 0 2 5 4 7 4 3 4 1 8 7 4 0 7 1 1 第一行代表工作时间,而不是暂停等交替方式。为了可
我需要有关小型 SQL 查询的帮助。考虑下表: TicketNo | Rules | Audit Result --------------------------------- P
我有一个非常大的表(~1 000 000 行)和带有联合、连接和 where 语句的复杂查询(用户可以选择不同的 ORDER BY 列和方向)。我需要获取分页的行数。如果我运行查询而不计算行数,它会很
我想获取数据帧的行数。 我可以通过 size(myDataFrame)[1] 实现这一点. 有更干净的方法吗? 最佳答案 如果您正在使用 DataFrames具体来说,那么你可以使用 nrow() :
是否可以在带有千位分隔符的 VIM 状态栏中显示行数,最好是自定义千位分隔符? 例子: set statusline=%L 应该导致“1,234,567”而不是“1234567”。 最佳答案 我找到了
我有一个非常基本的问题,但不知道该怎么做。如果 mysql 表中的行数增加,我想刷新页面。我已经尝试了一些不同的事情,比如在表中添加一个单独的列,如果行数和这个值相等,则值为 (id + 1),然后进
我的 mysql TB 中的行数(如 TB 信息中所示)是 11093,而自动递增 ID(从 1 开始)是 11361。为什么会这样? 最佳答案 删除的行不会重置 AI 索引。行数是当前表中的条目数,
我有一个 MySQL 表如下。 emp_no emp_name dob gender 1 A 1978-10-10 Male 2 B
ifstream inFile; inFile.open(filename); //open the input file stringstream strStream; strStream << i
SELECT * FROM table1 WHERE EXISTS (SELECT * FROM table2 WHERE *condition*) 例如,我可以检查是否有 3 行符合 table2
我正在尝试提取 SQL 表中的总行数。 我正在使用以下代码: $rowNum = mysql_query("SELECT COUNT(*) FROM Logs"); $count = mysql_fe
我想知道表格 View 的行宽是多少,UITableViewCell 文本标签的字体是什么,有人可以帮我吗? 最佳答案 NSLog(@"width: %f", cell.frame.size.widt
对于以下内容: def linecount(filename): count = 0 for x in open(filename): count += 1 r
感谢关注。 我用C语言写了一段代码来统计字数、行数和字符数。 while((c = fgetc(fp)) != EOF) { if((char)(c) == ' ' || (char)(c)
我是 matlab 的新手,只需要更改代码中的一个非常小的东西。我有以下矩阵: ans = 1 1 1 1 2 1 2 1
我只是想弄清楚如何确定行数,然后使该数字显示在 HTML 中。 我准备好的声明如下所示: if($stmt = $mysqli -> prepare("SELECT field1, field2, f
PDO 显然无法计算从选择查询返回的行数(mysqli 有 num_rows 变量)。 除了使用 count($results->fetchAll()) 之外,有没有办法做到这一点? 最佳答案 根据手
SELECT count(*) FROM Stack WHERE Id = 33478 GROUP BY SID Output: (No column name) 1 4 对于结果;有两排。怎么退货
IE。如果我们有一个包含400万行的表。 其中具有一个STATUS字段,该字段可以采用以下值:TO_WORK,BLOCKED或WORKED_CORRECTLY。 您是否会在一个仅会更改一次的字段上进行
所以在JTextArea中有一个getLineCount()是否有与JTextPane类似的东西,因为我可以找到任何东西。也许有不同的方法来获得它?我想获取当前存在的行数。 最佳答案 (正如您所指出的
我是一名优秀的程序员,十分优秀!