gpt4 book ai didi

python - 在 Python 中计算 CSV 中的每月总值

转载 作者:行者123 更新时间:2023-12-01 02:07:12 31 4
gpt4 key购买 nike

我正在尝试在 csv 数据集中记录 2.5 年来的每月销售总额。

我从一个 SKU 交易历史记录的 csv 文件开始,该文件按日期 (MM/DD/YYYY) 排序,并具有不同的状态,指示该商品是已售出、已存档(已报价、未售出)还是已打开。我设法弄清楚如何仅显示“已售出”行,但无法弄清楚如何显示每月销售的总金额。这是我迄今为止所拥有的。

#Import Libraries
from pandas import DataFrame, read_csv
import pandas as pd

#Set Variables
fields = ['Date', 'Qty', 'Status']
file = r'kp4.csv'
df = pd.read_csv(file, usecols=fields)

# Filters Dataset to only display "Sold" items in Status column
data = (df[df['Status'] == "Sold"])

print (data)

输出:

             Date Qty Status
4 2/21/2018 5 Sold
4 2/21/2018 5 Sold
11 2/16/2018 34 Sold
14 3/16/2018 1 Sold

我理想的输出看起来像这样:

         Date   Qty  Status
4 02/2018 39 Sold
5 03/2018 1 Sold

我尝试过 groupy、操纵年份格式、根据其他教程分配索引,但除了错误之外什么也没得到。如果有人能指出我正确的方向,我将不胜感激。

谢谢!

最佳答案

IIUC

df.Date=pd.to_datetime(df.Date)
df=df.drop_duplicates()

df.groupby(df.Date.dt.strftime('%m/%Y')).agg({'Qty':'sum','Status':'first'})
Out[157]:
Qty Status
Date
02/2018 39 Sold
03/2018 1 Sold

关于python - 在 Python 中计算 CSV 中的每月总值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48940313/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com