- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
在使用 Python
的 pandas
库放大数据帧时,我遇到了意外行为。
让我们从每月数据开始:
carMonthly = pd.DataFrame(data={'avSpeed': [40.3, 23.4], 'dist': [100, 150]},
index=pd.PeriodIndex(['2019-02', '2019-05'], freq='M'))
avSpeed dist
2019-02 40.3 100
2019-05 23.4 150
请注意我如何使用每月频率的 PeriodIndex
。
现在,我想通过以下方式将此集合重新调整为每日值:
avSpeed
值复制到该特定月份的每一天;dist
值必须除以每个月的天数(第一行 28 天,第二行 31 天)。所以,我希望的结果是:
avSpeed dist
2019-02-01 40.3 3.571428
2019-02-02 40.3 3.571428
...
2019-02-27 40.3 3.571428
2019-02-28 40.3 3.571428 #until end of February
2019-05-01 23.4 4.838710
2019-05-02 23.4 4.838710
...
2019-05-30 23.4 4.838710
2019-05-31 23.4 4.838710
请注意 March 和 April 是如何不存在的。如果那不可能,并且生成的重采样将始终包括三月和四月,我的第二好的结果是那些月份的所有行都包含 NaN
值。
对于那些对我的尝试感兴趣的人:
carDaily = pd.DataFrame()
carDaily['avSpeed'] = carMonthly['avSpeed'].resample('D').ffill()
tempSeries = carMonthly['dist'].resample('D').first()
carDaily['dist'] = tempSeries.groupby(tempSeries.notna().cumsum())\
.apply(lambda x: x/len(x.index)).ffill()
avSpeed dist
2019-02-01 40.3 1.123596
2019-02-02 40.3 1.123596
...
2019-04-29 40.3 1.123596
2019-04-30 40.3 1.123596 #until end of April
2019-05-01 23.4 4.838710
2019-05-02 23.4 4.838710
...
2019-05-30 23.4 4.838710
2019-05-31 23.4 4.838710
这是不需要的,因为2 月份的数据一直延伸到 4 月底。因为原始数据集有每月一次的频率,而 carMonthly
数据集中的每一行都涵盖了一个月的时间段,所以我想要复制(avSpeed
)或除以( dist
) 限制在 carDaily
数据集中实际位于其数据来自的月份内的那些行,如“首选结果”下所示。
我知道它为什么不起作用:重采样的 Series
对所有行(包括三月和四月)都有 NaN
值,2019-02-01 除外
和 2019-05-01
,那时无法找出原始的 start_time
和 end_time
几个月是。我只是不知道,如何让它工作:)
PS:dist
列的解决方案取自this问题。
与 this在下面回答,我现在正在使用这段代码,它允许我逐列构建新的数据框:
tempDf = carMonthly.groupby(level=0).apply(lambda x : x.resample('D').ffill())
il = tempDf.index.labels[0]
divBy = [sum(il==i) for i in il]
carDaily = pd.DataFrame()
carDaily['avSpeed'] = tempDf['avSpeed']
carDaily['dist'] = tempDf['dist'] / divBy
carDaily.reset_index(level=0,drop=True,inplace=True)
divBy
列表 (il = FrozenNDArray([0, 0, 0, 0, 0, 0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1 , 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 , 1, 1], dtype='int8')
).pandas
作为外部库。最佳答案
你应该在 groupby
中 resample
s=carMonthly.groupby(level=0).apply(lambda x : x.resample('D').ffill())
s['dist']/=s.groupby(level=0)['avSpeed'].transform('count').values
s.reset_index(level=0,drop=True,inplace=True)
关于python - 放 Pandas 数据框时,不要填写超出每一行的时间段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55834815/
我想要以下代码的 Python 单行解决方案,但是怎么做呢? total = 0 for ob in self.oblist: total += sum(v.amount for v in o
今天和大家一起学习一种可视化技术:构建树状热力图treemap。树形图易于可视化,且易于被人理解。树状图通过展示不同大小的矩形,以传达不同大小的数据量,一般认为,较大的矩形意味着占总体的一大部分,而较
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我有一个声明 $set eq "Y" ? $set = "N" : $set = "Y"; 但不管它总是设置为 "N" # Toggle setting if ($set eq "Y") { $
当我尝试在我的服务器上上传一个 php 文件时,我收到一条消息:"Parse error: ..." 我知道这是什么意思,但问题是别的。 如果我在本地服务器上编辑文件(我的计算机上安装了 XAMPP)
我是 python oneliner 循环的新手。 我希望用户将数据输入到二维列表中,同时提醒他他们将输入的数据索引。我的代码是: flag=0 x=[[int(input("enter the "+
尝试在变量之前和之后打印字符串。C 是否有能力使用一条语句来显示此输出? 这有效: float value = 5; printf("\nThe value of %f", value); print
我正在验证我创建的 MySQL 数据库的结果,为此,我需要一些屏幕截图。 例如,以下查询: select distinct run_ID from ngsRunStats_FK.failedRuns
有人可以解释一下这个 JS LINE 吗?数据是一个对象。 var list = data == null ? [] : (data.wine instanceof Array ? data.wine
如何在一行中添加三个下拉菜单。我想把我的日、月和年放在一行中,但不能这样做。任何帮助将不胜感激。我附上我的 jsfiddle . .... 最佳
我正在尝试使用 html 将 iframe 的高度设置为 100%(我已成功完成),但我还在顶部添加了一行额外的文本,所以它太高了 ~16px(这需要一个滚动条)。有没有办法更改 iframe 以显示
这是一个示例,我从文件中读取行作为字符串,以使整个文件作为字符串数组: String[] ArrayOfStrings = (new Scanner( new File("log.txt") ).us
我有一个包含大量定义的配置文件,用于在编译期间包含模块。此外,这意味着我必须经常检查代码内部的定义。每张支票需要 3 行,是否可以在一行中执行此操作。 #if FUNC_ENABLED functio
我正在尝试制作一个水平列表,其中每个 列表中的 s 的高度为 385px,宽度为 400px。 我尝试使用 inline-block 使列表水平排列,但这似乎不起作用。也就是说,我的意思是列表仍然是垂
这很烦人,我有一个带有 css 文件的 wordpress 主题,所有内容都在一长行中。我想知道为什么有人会那样做。现在我已经升级了,我需要将旧文件与新文件进行比较,以便我可以接受更改。 Meld、d
我有一个对象数组,其中每个对象都有一个 search_order 属性。我要检查数组并将所有对象的属性增加 1这是简单的方法: res = [] for r in array: r.searc
我在某些服务器上遇到许多具有相同内容和相同名称的文件。我需要隔离这些文件进行分析,所以我不能只删除重复项。操作系统为Linux(centos和ubuntu)。 我枚举文件名和位置并将它们放入文本文件中
你能在不抛出错误的情况下解决这个问题吗?答案是单线。这是来自一个死的职位发布,在回复中要求回答。我认为这是剔除受访者的聪明方法,但我似乎无法在不出错的情况下回答它。 显而易见的解决方案: f.moo(
这个问题在这里已经有了答案: Is it ok if I omit curly braces in Java? [closed] (16 个答案) 关闭 9 年前。 我在 java 中使用没有大括号
我在这里试图用 python 制作一个简单的计算器,我想知道是否可以在命令运行时将前 3 行合并为一行。我的意思是;我不必按 Enter 键来键入下一个数字/运算符,而是按空格键(在输入部分)。 wh
我是一名优秀的程序员,十分优秀!