- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个具有以下结构的数据框 (df):
转推日期时间 | tweet_id | tweet_datetime |
---|---|---|
2020-04-24 03:33:15 | 85053699 | 2020-04-24 02:28:22 |
2020-04-24 02:43:35 | 85053699 | 2020-04-24 02:28:22 |
2020-04-18 04:24:03 | 86095361 | 2020-04-18 00:06:01 |
2020-04-18 00:19:08 | 86095361 | 2020-04-18 00:06:01 |
2020-04-18 00:18:38 | 86095361 | 2020-04-18 00:06:01 |
2020-04-18 00:07:08 | 86095361 | 2020-04-18 00:06:01 |
retweet_datetime 是从最新到最新的转推排序。
我想创建两个新列,如下所示:
tweet_lifetime1
:最后一次转推时间和第一次转推时间的差值,即对于每个tweet_id:last retweet_datetime - first retweet_datetimetweet_lifetime2
:上次转发时间与推文创建时间的差值(tweet_datetime
)例如,对于推文 ID:“86095361”:
tweet_lifetime1
= 2020-04-18 04:24:03 - 2020-04-18 00:07:08
(04:16:55
)tweet_lifetime2
= 2020-04-18 04:24:03 - 2020-04-18 00:06:01
(04:18:02
)预期输出df:
转推日期时间 | tweet_id | tweet_datetime | 一生1 | lifetime2 |
---|---|---|---|---|
2020-04-24 03:33:15 | 85053699 | 2020-04-24 02:28:22 | 00:49:40 | 01:04:53 |
2020-04-18 04:24:03 | 86095361 | 2020-04-18 00:06:01 | 04:16:55 | 04:18:02 |
我看过几个类似的帖子,但它们大多是减去连续的行。例如,我可以为每个 tweet id 减去每个 retweet_datetimes 之间的时间差,如下所示:
df2 = df.assign(delta = df.groupby('tweet_id')['retweet_datetime'].diff())
最佳答案
Groupby 和 agg 使用 first
选择每组的第一行,然后 groupby 和 agg retweet_datetime
使用 last
选择每组的最后一个值.然后 join
聚合数据帧并通过减去相关列来计算 lifetime1
和 lifetime2
g = df.groupby('tweet_id')
s = g.first().join(g['retweet_datetime'].agg(['last']))
s['lifetime1'] = s['retweet_datetime'] - s.pop('last')
s['lifetime2'] = s['retweet_datetime'] - s['tweet_datetime']
retweet_datetime tweet_datetime lifetime1 lifetime2
tweet_id
85053699 2020-04-24 03:33:15 2020-04-24 02:28:22 0 days 00:49:40 0 days 01:04:53
86095361 2020-04-18 04:24:03 2020-04-18 00:06:01 0 days 04:16:55 0 days 04:18:02
关于python - 从 Pandas Dataframe 中每个 Id 的第一个时间戳中减去最后一个时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72863564/
我有两个列表,我想从 neg 中减去列表 pos 中元素的频率。所以: neg = [x for x in all[:800000]] pos = [x for x in all[800000:]]
我有两个列表,我想从 neg 中减去列表 pos 中元素的频率。所以: neg = [x for x in all[:800000]] pos = [x for x in all[800000:]]
我正在尝试减去 2 个标准逻辑向量并得到错误 p2 <= p1(11 downto 0)- idata(11 downto 0); Error (10327): VHDL error at sub.v
我将以下代码嵌入到类中。每当我运行 distToPoint 时,它都会给出错误“不支持的操作数类型 -: 'NoneType' 和 'float'” 我不知道为什么它会返回 NoneType 和如何让
这一直让我想知道, 假设我有这种情况: select (...long sub query..) - (...long sub query..) 我想把 - 放在条件中,这意味着有时它会是 - 有时是
我有两个 vector 。我需要从 vector1 中删除 vector2 中的内容。 [编辑:不清楚这是否意味着按照下面的链接或设置差异进行逐元素减法] 我使用 Visual Studio 2010
我有一张这样的 table : id product_property_id product_id amount type 1 1 145 10
我有两个 boolean 值列表 buy_machine 和 broken_machine。我想创建第三个列表 working_machines,它是购买的机器数量的总和并减去坏机器的数量。 我尝试了
我似乎可以解决这个问题。我有两个来自 sql 的访问者/国家/地区列表 us,us,uk,fr,uk,uk,uk 和 us,uk 我用 array_count_values() 将它们制成数组: Ar
我在 javascript 中减去时间时遇到了麻烦,尽管我已经谷歌搜索了 2 天但没有任何运气:( 我正在尝试为调查问卷计时。当用户开始调查问卷时,会记录时间戳。当用户完成/单击提交时,会记录新的时间
我正在尝试对 flex 搜索中索引的字段进行一些分析。 其中两个字段是“start_time”和“end_time”。我基本上希望将这两个字段的差异分组,即('end_time'-'start_tim
我有一个函数,它接收两个 BigDecimal 数字,即 bd1 和 bd2 作为参数。该函数应减去 bd1 - db2 并返回 bd1 和 bd2 的小数位数均为 2,结果的小数位数也应仅为 2但使
根据ldt_code中的ld源代码here。没有将dl_main传递给phdr的上下文,我对为什么通过减去虚拟地址来推断main_map的加载地址有些困惑。 我跟踪过的代码: 1124 static
我进行了多次重复测量的治疗,我想减去每次治疗的每个时间点的对照值。数据集的形状是这样的,有多年、物种和处理。 ID Year Species Treatment value 1 2010 x
我正在尝试查找一次旅行的矩形区域,可以在此处找到更多上下文 我在下面的代码中遇到的错误是: "Exception in thread "main" java.lang.ArrayIndexOutOfB
我一直在尝试使用 pandas dataframe 减去我读入 python 的列之间的日期和时间。我写的代码如下: Time = df['t'] - df['t'].shift(1) + df['t
I want to subtract all values in a[nn,...,0] by b[nn] while keeping the original structure of the ar
假设我有两个列表:List l1,和 Listl2 请帮助我如何在 2 个列表之间合并、减去和相交。谢谢。 注意:我使用的是 .NET 2.0,所以我不能使用 LINQ。谢谢。 最佳答案 以下是伪代码
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
我正在尝试运行以下代码: extern crate unicase; use unicase::UniCase; use std::collections::HashSet; fn main() {
我是一名优秀的程序员,十分优秀!