python - python 中高效的 group by 和 where 子句-6ren

python - python 中高效的 group by 和 where 子句

转载作者：太空宇宙更新时间：2023-11-04 08:47:34

25

4

我有每周(比如 5 周) 销售和购物篮的产品和商店组合，我想找到产品的总支出和访问量(不论商店)对于特定的周(比如 201520)”，即 2015 年的第 20 周。当我选择一周时，可能会有一些产品在那一周没有售出.但我不想将它们从我的组中删除。基本上我希望所有产品在 5 周内售出，但如果产品在我上面选择的那一周内没有售出，我希望它出现在我的最终 dataFrame 中，汇总数字为 0。示例数据。(让假设产品 122 在 201520 周未售出)

prod store week    baskets sales
123  112   201518  20      100.45
123  112   201519  21      89.65
123  112   201520  22      1890.54
122  112   201518  10      909.99

样本输出(201520)

prod total_baskets   total_sales  spend_per_basket
123  22              1890.54      85.93363636
122  0               0            0

我知道这可以使用 groupby 和 pandas 来完成。但我正在做多个步骤。我正在寻找一种更 pythonic 和有效的方式。目前
我首先选择要进行 groupby 的那一周。
然后创建我的初始每周数据集中存在的所有产品的列表。
然后按数据重新回到组中。我发现这效率不高。请帮忙。还需要创建每个购物篮的支出。如果 total_baskets > 0，则 spend_per_basket 为 total_sales/total_baskets。否则 0 TIA。虚拟代码:

trans_for_my_week=weekly_trans[weekly_trans['week']==201520]    
avg_sales=pd.DataFrame(trans_for_my_week.groupby(['prod']).agg({'baskets':      {'total_baskets':'sum'},
                                                 'sales' :{'total_sales':'sum'}}))
avg_sales_period_0.columns=avg_sales_period_0.columns.droplevel(0)
avg_sales_period_0=avg_sales_period_0.reset_index()

等等

关于使用下面提供的解决方案:在编写以下代码时，出现一些错误:

x=round(res.sales / res.baskets,4)
x.columns = pd.MultiIndex.from_product(['spend_per_basket', res.columns.get_level_values(1).drop_duplicates()])

打印(x)

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-38-fbb15ec86cc6> in <module>()
      7 
      8 x=round(res.sales / res.baskets,4)
----> 9 x.columns = pd.MultiIndex.from_product(['spend_per_basket', res.columns.get_level_values(1).drop_duplicates()])
     10 print(x)

/usr/lib64/python3.4/site-packages/pandas/indexes/multi.py in from_product(cls, iterables, sortorder, names)
   1022         from pandas.tools.util import cartesian_product
   1023 
-> 1024         labels, levels = _factorize_from_iterables(iterables)
   1025         labels = cartesian_product(labels)
   1026 

/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in _factorize_from_iterables(iterables)
   2066         # For consistency, it should return a list of 2 lists.
   2067         return [[], []]
-> 2068     return map(list, lzip(*[_factorize_from_iterable(it) for it in iterables]))

/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in <listcomp>(.0)
   2066         # For consistency, it should return a list of 2 lists.
   2067         return [[], []]
-> 2068     return map(list, lzip(*[_factorize_from_iterable(it) for it in iterables]))

/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in _factorize_from_iterable(values)
   2028 
   2029     if not is_list_like(values):
-> 2030         raise TypeError("Input must be list-like")
   2031 
   2032     if is_categorical(values):

TypeError: Input must be list-like

最佳答案

您还可以使用 pivot_table 获得您需要的东西，虽然方法有点不同，但您正在寻找单行代码:

print(pd.pivot_table(df, index = 'week', columns = 'prod', values = 'sales', aggfunc = 'sum').fillna(0))

输出:

prod       122      123
week                   
201518  909.99   100.45
201519    0.00    89.65
201520    0.00  1890.54

关于python - python 中高效的 group by 和 where 子句，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38801205/

25

4

0

文章推荐： python - 抽象类子类的函数注解

文章推荐： c - 在 C 中读取整个标准输入直到 EOF

文章推荐： c - 在C中将字符串拆分为一定大小的字符串

文章推荐： python - 为什么 pool.map() 和 map() 返回不同的结果？

sql-server - 非聚集索引上的 Where 子句 Vs 额外连接和聚集索引上的 where 子句
我试图从一些 sql 查询中获得一些额外的性能，这些查询在一个字段上有一个 where 子句，它是一个非唯一的非聚集索引，它也是表 A 中的一个外键。该外键是主键在表 B 上，是聚集索引。我想知道的
batch-file - 结合 For/F 与 WMIC + WHERE 子句 + AND 子句
当包含在 FOR 中时，应该如何编写此 WMIC 命令脚本中的命令？ wmic service where (name="themes" and state="running") get 下面的代码不
TSQL:over 子句
请帮我理解如何订购对over子句的影响。我已经阅读了 msdn 和一本书，但仍然误解了。假设我们有这样的查询: SELECT Count(OrderID) over(Partition By Ye
SQL:HAVING 子句
参见如下SQL语句: SELECT datediff("d", MAX(invoice.date), Now) As Date_Diff , MAX(invoice.date) AS ma
CodeigniterWhere 子句
不知何故，对我来说构建这样的查询有点困难:给我所有链接名称不为空的导航条目 $query = $this->db->get_where('navigation',array('linkname'!==
SQL ALL IN 子句
我一直在寻找这个，但没有发现任何特别的东西。是否可以有一个像 ALL IN 一样的 SQL 查询？为了更好地解释，这是一个表结构。 Orders table OrderItem table (hav
SQL:Where 子句
SELECT DISTINCT Campaign_id FROM Impressions WHERE Date BETWEEN '2015-03-01' AND '2015-03-31' ; 上述查询
MyBatis if 子句
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
sql - & IN WHERE 子句
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
MyBatis if 子句
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
mySQL where in 子句
是否可以用 where in 子句做这样的事情，我需要使用 where in 查询以下数据。 select * FROM instructor AS i INNER JOIN teaches AS t
mysql - IF on WHERE 子句
嗨，我怎样才能让这个查询工作。我想要一个关于 where 子句的条件，如果 @BACHNUMB = ''，那么 WHERE 是 (h.sopnumbe = @SOPNUMBE) 否则 WHERE 是
c# - WHERE IN 子句
我在 MVC3 项目中工作。我浏览了一段时间并尝试了几个示例，但无法正常工作。我需要从 OrderForm 表中获取记录列表，其 DeptID 在我已经获得的另一个列表中。我知道我需要使用 Con
Mysql where 子句
select * from staff LEFT JOIN servicereservation on servicereservation.snic = staff.snic where servi
MySQL "WITH"子句
我正在尝试使用 MySQL 创建带有“WITH”子句的 View WITH authorRating(aname, rating) AS SELECT aname, AVG(quantity)
MySQL When 子句
我正在尝试使用 MySQL 创建触发器，但遇到错误。限制是:用户不得对他或她同时销售的商品出价。 Create Trigger before_insert_bid Before Insert on B
PostgreSQL WHERE IN 子句
我正在尝试在 PostgreSql 的 WHERE IN 子句中使用 split_part，如下所示。这里 Objcode 是 small int 类型，objection 可能像 1374,824,
mysql if in where 子句
这可能很简单，只是我太厚了 - 我试图阻止保留的元素在记录中被拾取，但只有当库存大于 0 时，我不知道该怎么做除非 "....WHERE blah blah AND (reserved = 0 OR
MySQL if then 子句
我总结了两个表中两列的行，即如下所示: SUM( tableA.age ) + sum( tableB.age) as 'Total Ages' 但在某些情况下，A表的结果为空，而B表的结果则不是。在
mysql AS 子句
我写了一个查询，从出生日期字段开始计算出一个人的年龄，然后使用 AS age 创建一个年龄字段。我的问题是，是否可以再次匹配那个年龄字段？像这样， SELECT `candidates`.`can

首页

博学

6Ren·AI

商城

python - python 中高效的 group by 和 where 子句