- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
这与上一个问题相关:Python pandas change duplicate timestamp to unique ,因此与此名称类似。
额外的要求是每秒处理多个重复项,并将它们均匀地分布在第二个边界之间,即
....
2011/1/4 9:14:00
2011/1/4 9:14:00
2011/1/4 9:14:01
2011/1/4 9:14:01
2011/1/4 9:14:01
2011/1/4 9:14:01
2011/1/4 9:14:01
2011/1/4 9:15:02
2011/1/4 9:15:02
2011/1/4 9:15:02
2011/1/4 9:15:03
....
应该变成:
....
2011/1/4 9:14:00
2011/1/4 9:14:00.500
2011/1/4 9:14:01
2011/1/4 9:14:01.200
2011/1/4 9:14:01.400
2011/1/4 9:14:01.600
2011/1/4 9:14:01.800
2011/1/4 9:14:02
2011/1/4 9:14:02.333
2011/1/4 9:14:02.666
2011/1/4 9:14:03
....
我对如何处理可变数量的重复项感到困惑。
我按照groupby()
的思路思考,但无法正确理解。我认为这是一个足够常见的用例,已经解决了。
最佳答案
我将日期时间列转换为timedelta[ms]
。但问题是数字太大,所以首先我将年份转换为 epoch time - 2011 - 1970
。然后我计算了差异,这些差异被添加到第一列:df['one'] = df['one'] - df['new'] + df['timedelta']。
然后是 timedeltas整数毫秒转换为时间增量,最后添加年份 2011 - 1970
。
# time
#0 2011-01-04 09:14:00
#1 2011-01-04 09:14:00
#2 2011-01-04 09:14:01
#3 2011-01-04 09:14:01
#4 2011-01-04 09:14:01
#5 2011-01-04 09:14:01
#6 2011-01-04 09:14:01
#7 2011-01-04 09:15:02
#8 2011-01-04 09:15:02
#9 2011-01-04 09:15:02
#10 2011-01-04 09:15:03
#time datetime64[ns]
#remove years for less timedeltas
df['time1'] = df['time'].apply(lambda x: x - pd.DateOffset(years=2011-1970))
#convert time to timedeltas in miliseconds
df['timedelta'] = pd.to_timedelta(df['time1']) / np.timedelta64(1, 'ms')
df['one'] = 1
#count differences by groupby and transforming mean/sum
m = lambda x: (x.mean()) / x.sum()
df['one'] = df.groupby('time')['one'].transform(m)
#cast float to integer
df['new'] = (df['one']*1000).astype(int)
#need differences by cumulative sum
df['one'] = df.groupby('time')['new'].transform(np.cumsum)
#column cumulatice sum substracting differences and added timedelta
df['one'] = df['one'] - df['new'] + df['timedelta']
#convert integer to timedelta
df['final'] = pd.to_timedelta(df['one'],unit='ms')
#add removed years
df['final'] = df['final'].apply(lambda x: pd.to_datetime(x) + pd.DateOffset(years=2011-1970))
#remove unnecessary columns
df = df.drop(['time1', 'timedelta', 'one', 'new'], axis=1)
print df
# time final
#0 2011-01-04 09:14:00 2011-01-04 09:14:00.000
#1 2011-01-04 09:14:00 2011-01-04 09:14:00.500
#2 2011-01-04 09:14:01 2011-01-04 09:14:01.000
#3 2011-01-04 09:14:01 2011-01-04 09:14:01.200
#4 2011-01-04 09:14:01 2011-01-04 09:14:01.400
#5 2011-01-04 09:14:01 2011-01-04 09:14:01.600
#6 2011-01-04 09:14:01 2011-01-04 09:14:01.800
#7 2011-01-04 09:15:02 2011-01-04 09:15:02.000
#8 2011-01-04 09:15:02 2011-01-04 09:15:02.333
#9 2011-01-04 09:15:02 2011-01-04 09:15:02.666
#10 2011-01-04 09:15:03 2011-01-04 09:15:03.000
关于Python pandas 将可变数量的重复时间戳更改为唯一,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33528394/
为什么禁用类型像 type t = A of int | B of string * mutable int 虽然允许此类类型: type t = A of int | B of string * i
我正在寻找一种类似结构的数据结构,我可以从中创建多个实例并具有某种类型提示而不是不可变的。 所以我有这样的东西: class ConnectionConfig(NamedTuple): nam
我需要转到引用的结构: class SearchKnot { var isWord : Bool = false var text : String = "" var to
如sec 10.4.3中所述 当控制进入执行时,执行以下步骤 功能对象F(调用者)中包含的功能代码的上下文 提供thisArg,而调用方提供argumentsList: 如
i make a game that start display Activity indicator And activity indicator bottom display UiLable wi
编辑:我在这里不断获得支持。只是为了记录,我认为这不再重要。自从我发布它以来我就不再需要它了。 我想在 Scala 中执行以下操作... def save(srcPath: String, destP
使用可变对象作为 Hashmap 键是一种不好的做法吗?当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时,会发生什么? 例如,给定 class Key { int a; /
如果您在Kotlin中访问List类型的Java值,则将获得(Mutable)List!类型。 例如。: Java代码: public class Example { public stati
我编写了 str 类(内置)的以下扩展,以便执行以下操作:假设我有字符串 "Ciao" ,通过做"Ciao" - "a"我想要的结果是字符串 "Cio" 。这是执行此操作的代码,并且运行良好: cla
使用可变对象作为 Hashmap 键是一种不好的做法吗?当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时,会发生什么? 例如,给定 class Key { int a; /
我正在为我的公司设计一个数据库来管理商业贷款。每笔贷款都可以有担保人,可以是个人或公司,在借款业务失败时作为财务支持。 我有 3 个表:Loan、Person 和 Company,它们存储明显的信息。
我使用二进制序列化从 C# 类中保存 F# 记录。一切正常: F#: type GameState = { LevelStatus : LevelStatus
import javax.swing.JOptionPane; public class HW { public static void main(String[] args) { Strin
使用 flatbuffer mutable 有多少性能损失? 是否“正确”使用 FlatBuffers 来拥有一个应该可编辑的对象/结构(即游戏状态) 在我的示例中,我现在有以下类: class Ga
std::function create_function (args...) { int x = initial_value (args...); return [x] () mut
我需要在 for 循环中找到用户输入的字符。我通常会这样做 如果(句子[i] == 'e') 但是因为在这里,'e' 将是一个单字母字符变量,我不知道如何获取要比较的值。我不能只输入 if (sent
我有一个这样的算法: let seed: Foo = ... let mut stack: Vec = Vec::new(); stack.push(&seed); while let Some(ne
这个问题可能看起来非常基础,但我很难弄清楚如何做。我有一个整数,我需要使用 for 循环来循环整数次。 首先,我尝试了—— fn main() { let number = 10; // An
如果我有以下结构: struct MyStruct { tuple: (i32, i32) }; 以及以下函数: // This will not compile fn function(&mut s
我希望在每个 session 的基础上指定列的默认值。下面的脚本不起作用,但描述了我想如何使用它。我目前使用的是 MySQL 5.5.28,但如果需要可以升级。 CREATE TABLE my_tbl
我是一名优秀的程序员,十分优秀!