- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有每周(比如 5 周) 销售和购物篮的产品和商店组合,我想找到产品的总支出和访问量(不论商店)对于特定的周(比如 201520)”,即 2015 年的第 20 周。当我选择一周时,可能会有一些产品在那一周没有售出.但我不想将它们从我的组中删除。基本上我希望所有产品在 5 周内售出,但如果产品在我上面选择的那一周内没有售出,我希望它出现在我的最终 dataFrame 中,汇总数字为 0。示例数据。(让假设产品 122 在 201520 周未售出)
prod store week baskets sales
123 112 201518 20 100.45
123 112 201519 21 89.65
123 112 201520 22 1890.54
122 112 201518 10 909.99
样本输出(201520)
prod total_baskets total_sales spend_per_basket
123 22 1890.54 85.93363636
122 0 0 0
我知道这可以使用 groupby 和 pandas 来完成。但我正在做多个步骤。我正在寻找一种更 pythonic 和有效的方式。目前
我首先选择要进行 groupby 的那一周。
然后创建我的初始每周数据集中存在的所有产品的列表。
然后按数据重新回到组中。我发现这效率不高。请帮忙。还需要创建每个购物篮的支出。如果 total_baskets > 0,则 spend_per_basket 为 total_sales/total_baskets。否则 0 TIA。 虚拟代码:
trans_for_my_week=weekly_trans[weekly_trans['week']==201520]
avg_sales=pd.DataFrame(trans_for_my_week.groupby(['prod']).agg({'baskets': {'total_baskets':'sum'},
'sales' :{'total_sales':'sum'}}))
avg_sales_period_0.columns=avg_sales_period_0.columns.droplevel(0)
avg_sales_period_0=avg_sales_period_0.reset_index()
等等
关于使用下面提供的解决方案:在编写以下代码时,出现一些错误:
x=round(res.sales / res.baskets,4)
x.columns = pd.MultiIndex.from_product(['spend_per_basket', res.columns.get_level_values(1).drop_duplicates()])
打印(x)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-38-fbb15ec86cc6> in <module>()
7
8 x=round(res.sales / res.baskets,4)
----> 9 x.columns = pd.MultiIndex.from_product(['spend_per_basket', res.columns.get_level_values(1).drop_duplicates()])
10 print(x)
/usr/lib64/python3.4/site-packages/pandas/indexes/multi.py in from_product(cls, iterables, sortorder, names)
1022 from pandas.tools.util import cartesian_product
1023
-> 1024 labels, levels = _factorize_from_iterables(iterables)
1025 labels = cartesian_product(labels)
1026
/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in _factorize_from_iterables(iterables)
2066 # For consistency, it should return a list of 2 lists.
2067 return [[], []]
-> 2068 return map(list, lzip(*[_factorize_from_iterable(it) for it in iterables]))
/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in <listcomp>(.0)
2066 # For consistency, it should return a list of 2 lists.
2067 return [[], []]
-> 2068 return map(list, lzip(*[_factorize_from_iterable(it) for it in iterables]))
/usr/lib64/python3.4/site-packages/pandas/core/categorical.py in _factorize_from_iterable(values)
2028
2029 if not is_list_like(values):
-> 2030 raise TypeError("Input must be list-like")
2031
2032 if is_categorical(values):
TypeError: Input must be list-like
最佳答案
您还可以使用 pivot_table 获得您需要的东西,虽然方法有点不同,但您正在寻找单行代码:
print(pd.pivot_table(df, index = 'week', columns = 'prod', values = 'sales', aggfunc = 'sum').fillna(0))
输出:
prod 122 123
week
201518 909.99 100.45
201519 0.00 89.65
201520 0.00 1890.54
关于python - python 中高效的 group by 和 where 子句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38801205/
我试图从一些 sql 查询中获得一些额外的性能,这些查询在一个字段上有一个 where 子句,它是一个非唯一的非聚集索引,它也是表 A 中的一个外键。该外键是主键在表 B 上,是聚集索引。 我想知道的
当包含在 FOR 中时,应该如何编写此 WMIC 命令脚本中的命令? wmic service where (name="themes" and state="running") get 下面的代码不
请帮我理解如何订购 对over子句的影响。我已经阅读了 msdn 和一本书,但仍然误解了。 假设我们有这样的查询: SELECT Count(OrderID) over(Partition By Ye
参见如下SQL语句: SELECT datediff("d", MAX(invoice.date), Now) As Date_Diff , MAX(invoice.date) AS ma
不知何故,对我来说构建这样的查询有点困难:给我所有链接名称不为空的导航条目 $query = $this->db->get_where('navigation',array('linkname'!==
我一直在寻找这个,但没有发现任何特别的东西。 是否可以有一个像 ALL IN 一样的 SQL 查询?为了更好地解释,这是一个表结构。 Orders table OrderItem table (hav
SELECT DISTINCT Campaign_id FROM Impressions WHERE Date BETWEEN '2015-03-01' AND '2015-03-31' ; 上述查询
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
是否可以用 where in 子句做这样的事情,我需要使用 where in 查询以下数据。 select * FROM instructor AS i INNER JOIN teaches AS t
嗨,我怎样才能让这个查询工作。我想要一个关于 where 子句的条件,如果 @BACHNUMB = '',那么 WHERE 是 (h.sopnumbe = @SOPNUMBE) 否则 WHERE 是
我在 MVC3 项目中工作。我浏览了一段时间并尝试了几个示例,但无法正常工作。 我需要从 OrderForm 表中获取记录列表,其 DeptID 在我已经获得的另一个列表中。 我知道我需要使用 Con
select * from staff LEFT JOIN servicereservation on servicereservation.snic = staff.snic where servi
我正在尝试使用 MySQL 创建带有“WITH”子句的 View WITH authorRating(aname, rating) AS SELECT aname, AVG(quantity)
我正在尝试使用 MySQL 创建触发器,但遇到错误。限制是:用户不得对他或她同时销售的商品出价。 Create Trigger before_insert_bid Before Insert on B
我正在尝试在 PostgreSql 的 WHERE IN 子句中使用 split_part,如下所示。这里 Objcode 是 small int 类型,objection 可能像 1374,824,
这可能很简单,只是我太厚了 - 我试图阻止保留的元素在记录中被拾取,但只有当库存大于 0 时,我不知道该怎么做除非 "....WHERE blah blah AND (reserved = 0 OR
我总结了两个表中两列的行,即如下所示: SUM( tableA.age ) + sum( tableB.age) as 'Total Ages' 但在某些情况下,A表的结果为空,而B表的结果则不是。在
我写了一个查询,从出生日期字段开始计算出一个人的年龄,然后使用 AS age 创建一个年龄字段。 我的问题是,是否可以再次匹配那个年龄字段? 像这样, SELECT `candidates`.`can
我是一名优秀的程序员,十分优秀!