c# - 按组填写缺失日期-6ren

c# - 按组填写缺失日期

转载作者：太空狗更新时间：2023-10-30 00:07:06

26

4

我有一个看起来像这样的数据集:

shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-12,12

在由“shop_id 和”item_id 定义的每个组中，缺少日期。

我希望将这个不规则的时间序列扩展为每个组内具有连续日期的常规时间序列:

shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-12,0 # <~~ added
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-11,0 # <~~ added
150,2,2015-07-12,12

对于添加的日期，相应的值应该为零。尽管我读过非常相似的问题(使用 R 或 SQL 合并)，但我看到的大多数解决方案都不涉及 GROUP BY。

基本上我可以访问 SQL 数据库/我可以导出为 CSV 以进行操作，最好是在 C# 中。希望找到可以执行此类数据操作但找不到的 C# 库。

如有任何建议或帮助，我们将不胜感激!

最佳答案

您可以使用 R 中的 data.table。假设 'time' 列属于 'Date' 类，

library(data.table)#v1.9.5+
DT1 <- setDT(df1)[, list(time=seq(min(time), max(time), by ='day')),
                    by =.(shop_id, item_id)]
setkeyv(df1, names(df1)[1:3])[DT1][is.na(value), value:=0]
#   shop_id item_id       time value
#1:     150       1 2015-07-10     3
#2:     150       1 2015-07-11     5
#3:     150       1 2015-07-12     0
#4:     150       1 2015-07-13     2
#5:     150       2 2015-07-10    15
#6:     150       2 2015-07-11     0
#7:     150       2 2015-07-12    12

在开发版本中，您也可以在不设置“ key ”的情况下执行此操作。安装开发版本的说明是 here

 df1[DT1, on =c('shop_id', 'item_id', 'time')][is.na(value), value:=0]
 #   shop_id item_id       time value
 #1:     150       1 2015-07-10     3
 #2:     150       1 2015-07-11     5
 #3:     150       1 2015-07-12     0
 #4:     150       1 2015-07-13     2
 #5:     150       2 2015-07-10    15
 #6:     150       2 2015-07-11     0
 #7:     150       2 2015-07-12    12

或者正如@Arun 所建议的，一个更有效的选择是

 DT1[, value := 0L][df1, value := i.value, on = c('shop_id', 'item_id', 'time')]
 DT1

关于c# - 按组填写缺失日期，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31502591/

26

4

0

文章推荐： python - intersphinx 链接到 pandas autodoc API

文章推荐： c# - 为什么异步单任务比普通单任务运行得更快？

文章推荐： python - 如何安装IMUsim

java - 填写 MBeanParameterInfo
在 JConsole 的 MBeans 选项卡中查看我的应用程序的 MBean 时，有“属性”和“操作”的子菜单。如果将这些树结构展开到最大程度，然后单击其中一个操作，则右侧面板会显示三个部分:操作调
if-statement - 填写 ={ARRAYFORMULA()} 中的空白单元格
我有一个包含稀疏数据的人性化工作表: PART | FRUIT --------------- Alpha | | Apples | Pears Beta |
python - 填写 Pandas 数据框中缺少的小时数
我有一个包含每小时数据的数据框: area date hour output H1 2018-07-01 07:00:00 150 H1
javascript - 填写 html 表格
假设我有这样的 html 表: 16 3 2 13 5 10
r - 填写 R 数据框中缺失的行
我已经将一些原始数据导入到 R 中，如下所示: 表 1: ID Year Value 01 1999 25 01 2000 12 01 2002
r - 填写 R 数据框中缺失的行
我已经将一些原始数据导入到 R 中，如下所示: 表 1: ID Year Value 01 1999 25 01 2000 12 01 2002
python - 填写 PySpark 中前一天缺失的日期
我在以下问题中遇到了同样的问题: Forward Fill New Row to Account for Missing Dates 不同之处在于，我需要计算两个不同日期之间的小时数差异，例如 201
python - 填写 pandas 数据框中的缺失值
我想填写 pandas 数据框中缺失的值。最佳情况下，我希望分钟列的范围为每小时 0-60。不幸的是，数据生成过程没有记录任何 sub_count = 0 的行。有办法做到这一点吗？我的数据涵盖日期
javascript - 填写 addFullName 函数的代码
基本对象问题我似乎无法全神贯注。我确定我想多了。填写 addFullName 函数的代码。该函数应该: Take one input parameter, a person object. Add a
Android - 填写 html 表单并调用提交
是否可以在没有用户交互的情况下调用 html 表单提交？我知道可以通过 HttpClient 发出发布请求，但这并不能解决我的问题。我需要以编程方式在网页上填写一些表单输入字段，然后“单击”提交按钮
python - 填写 Pandas 数据框中的缺失值
Python 的新手，似乎无法找到我正在寻找的确切答案我相信有更简单的方法来填写此信息我有 df1 和 df2 df1: FirstName LastName PhNo uniqueid df
javascript - 填写 PDF 表格
您好，我有一个需要填写的 PDF 表单。该应用程序向用户(表单)提出问题，提交时应将答案填写到 PDF 空白处以供打印。我熟悉 JS 和 Node(有一段时间没用过)。不使用 PHP。我会在我常去
python - 填写 groupby 的缺失日期
假设我有一个如下所示的数据框: ID DATE VALUE 1 31-01-2006 5 1 28-02-2006 5 1 31
javascript - 填写 4 个字符时自动切换到下一个输入字段
我想做的是，在填写四个字符时指向下一个选项卡。每个字段应有 4 个字符，完成后应移至下一个输入框。 $(".inputs").keyup(function () { if (this
javascript - 检查所有输入字段是否已使用 jQuery 填写
我有 3 个 div，每个都有几个输入字段和下一步按钮。我想编写一个 jQuery 片段，当单击下一个按钮时，它会检查以确保与按钮位于同一 div 内的所有输入字段都不为空。我已经尝试了以下但没有成
java - 填写 "secret word"字母
我正在做一个刽子手项目。我已经让大部分代码正常工作了。我无法工作的部分是“ secret 单词”有多个相同的字母。例如“hello”有 2 个“l”。这是代码部分的代码，如果猜测正确，它将“---
java - 填写 list
拥有抽象对象的集合:Set foes; 我想要一个这样的方法: List getFoesByType(TypeEnum type); 我已经尝试过: List result = new ArrayLi
javascript - scrapy 填写 POST 表单
我正在尝试使用 scrapy 填写 POST 表单，以尝试预订火车票。我以为 FormRequest 类可以做这件事，但我无法处理 javascript 表单。 Scrapy 爬虫什么都不返回。我
python - 填写 numpy ndarray 的最佳方法？
我使用以下代码生成带有渐变的图像。我逐个元素访问数组。有更好的方法吗？谢谢。 import cv2 import numpy as np x = np.ndarray((256,256,3), dty
python - 填写 pandas df 中缺少的日期
我有一个数据对应于数据库列表和差异行，以及它们的使用日期。 DB Dates USAGE ABC 03-06-2018 IN USE

首页

博学

6Ren·AI

商城

c# - 按组填写缺失日期