- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个电话数据集。我想计算每条记录有多少个事件调用。我找到了这个 question但我想避免循环和函数。
每个通话都有一个日期
、一个开始时间
和一个结束时间
。
数据框:
start end date
0 09:17:12 09:18:20 2016-08-10
1 09:15:58 09:17:42 2016-08-11
2 09:16:40 09:17:49 2016-08-11
3 09:17:05 09:18:03 2016-08-11
4 09:18:22 09:18:30 2016-08-11
我想要的:
start end date activecalls
0 09:17:12 09:18:20 2016-08-10 1
1 09:15:58 09:17:42 2016-08-11 1
2 09:16:40 09:17:49 2016-08-11 2
3 09:17:05 09:18:03 2016-08-11 3
4 09:18:22 09:18:30 2016-08-11 1
我的代码:
import pandas as pd
df = pd.read_clipboard(sep='\s\s+')
df['activecalls'] = df[(df['start'] <= df.loc[df.index]['start']) & \
(df['end'] > df.loc[df.index]['start']) & \
(df['date'] == df.loc[df.index]['date'])].count()
print(df)
我得到的:
start end date activecalls
0 09:17:12 09:18:20 2016-08-10 NaN
1 09:15:58 09:17:42 2016-08-11 NaN
2 09:16:40 09:17:49 2016-08-11 NaN
3 09:17:05 09:18:03 2016-08-11 NaN
4 09:18:22 09:18:30 2016-08-11 NaN
最佳答案
您可以使用:
#convert time and date to datetime
df['date_start'] = pd.to_datetime(df.start + ' ' + df.date)
df['date_end'] = pd.to_datetime(df.end + ' ' + df.date)
#remove columns
df = df.drop(['start','end','date'], axis=1)
循环解决方案:
active_events= []
for i in df.index:
active_events.append(len(df[(df["date_start"]<=df.loc[i,"date_start"]) &
(df["date_end"]> df.loc[i,"date_start"])]))
df['activecalls'] = pd.Series(active_events)
print (df)
date_start date_end activecalls
0 2016-08-10 09:17:12 2016-08-10 09:18:20 1
1 2016-08-11 09:15:58 2016-08-11 09:17:42 1
2 2016-08-11 09:16:40 2016-08-11 09:17:49 2
3 2016-08-11 09:17:05 2016-08-11 09:18:03 3
4 2016-08-11 09:18:22 2016-08-11 09:18:30 1
解决方案 merge
#cross join
df['tmp'] = 1
df1 = pd.merge(df,df.reset_index(),on=['tmp'])
df = df.drop('tmp', axis=1)
#print (df1)
#filtering by conditions
df1 = df1[(df1["date_start_x"]<=df1["date_start_y"])
(df1["date_end_x"]> df1["date_start_y"])]
print (df1)
date_start_x date_end_x activecalls_x tmp index \
0 2016-08-10 09:17:12 2016-08-10 09:18:20 1 1 0
6 2016-08-11 09:15:58 2016-08-11 09:17:42 1 1 1
7 2016-08-11 09:15:58 2016-08-11 09:17:42 1 1 2
8 2016-08-11 09:15:58 2016-08-11 09:17:42 1 1 3
12 2016-08-11 09:16:40 2016-08-11 09:17:49 2 1 2
13 2016-08-11 09:16:40 2016-08-11 09:17:49 2 1 3
18 2016-08-11 09:17:05 2016-08-11 09:18:03 3 1 3
24 2016-08-11 09:18:22 2016-08-11 09:18:30 1 1 4
date_start_y date_end_y activecalls_y
0 2016-08-10 09:17:12 2016-08-10 09:18:20 1
6 2016-08-11 09:15:58 2016-08-11 09:17:42 1
7 2016-08-11 09:16:40 2016-08-11 09:17:49 2
8 2016-08-11 09:17:05 2016-08-11 09:18:03 3
12 2016-08-11 09:16:40 2016-08-11 09:17:49 2
13 2016-08-11 09:17:05 2016-08-11 09:18:03 3
18 2016-08-11 09:17:05 2016-08-11 09:18:03 3
24 2016-08-11 09:18:22 2016-08-11 09:18:30 1
#get size - active calls
print (df1.groupby(['index'], sort=False).size())
index
0 1
1 1
2 2
3 3
4 1
dtype: int64
df['activecalls'] = df1.groupby('index').size()
print (df)
date_start date_end activecalls
0 2016-08-10 09:17:12 2016-08-10 09:18:20 1
1 2016-08-11 09:15:58 2016-08-11 09:17:42 1
2 2016-08-11 09:16:40 2016-08-11 09:17:49 2
3 2016-08-11 09:17:05 2016-08-11 09:18:03 3
4 2016-08-11 09:18:22 2016-08-11 09:18:30 1
时间:
def a(df):
active_events= []
for i in df.index:
active_events.append(len(df[(df["date_start"]<=df.loc[i,"date_start"]) & (df["date_end"]> df.loc[i,"date_start"])]))
df['activecalls'] = pd.Series(active_events)
return (df)
def b(df):
df['tmp'] = 1
df1 = pd.merge(df,df.reset_index(),on=['tmp'])
df = df.drop('tmp', axis=1)
df1 = df1[(df1["date_start_x"]<=df1["date_start_y"]) & (df1["date_end_x"]> df1["date_start_y"])]
df['activecalls'] = df1.groupby('index').size()
return (df)
print (a(df))
print (b(df))
In [160]: %timeit (a(df))
100 loops, best of 3: 6.76 ms per loop
In [161]: %timeit (b(df))
The slowest run took 4.42 times longer than the fastest. This could mean that an intermediate result is being cached.
100 loops, best of 3: 4.61 ms per loop
关于python - 如何在一行中计算数据框中的并发事件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39467341/
我正在尝试将 WPF CodeBehid 事件(如 Event、Handler、EventSetter)转换为 MVVM 模式。我不允许使用 System.Windows.Controls,因为我使用
我可能误解了 Backbone 中的事件系统,但是当我尝试以下代码时什么也没有发生。当我向 Backbone.Events 扩展对象添加新属性时,它不应该触发某种更改、更新或重置事件吗?就像模型一样吗
我遇到了一个简单的问题,就是无法弄清楚为什么它不起作用。我有一个子组件“app-buttons”,其中我有一个输入字段,我想听,所以我可以根据输入值过滤列表。 如果我将输入放在我有列表的根组件中,一切
System.Timers.Timer 的 Elapsed 事件实际上与 System.Windows.Forms.Timer 的 Tick 事件相同吗? 在特定情况下使用其中一种比使用另一种有优势吗
嗨,这个 javascript 代码段是什么意思。(evt) 部分是如此令人困惑.. evt 不是 bool 值。这个怎么运作? function checkIt(evt) { evt
我正在使用jquery full calendar我试图在事件被删除时保存它。 $('calendar').fullCalendar ({
我有两个链接的鼠标事件: $('body > form').on("mousedown", function(e){ //Do stuff }).on("mouseup", function(
这是我的代码: $( '#Example' ).on( "keypress", function( keyEvent ) { if ( keyEvent.which != 44 ) {
我尝试了 dragOver 事件处理程序,但它没有正常工作。 我正在研究钢琴,我希望能够弹奏音符,即使那个键上没有发生鼠标按下。 是否有事件处理程序? 下面是我正在制作的钢琴的图片。 最佳答案 您应该
当悬停在相邻文本上时,我需要使隐藏按钮可见。这是通过 onMouseEnter 和 onMouseLeave 事件完成的。但是当点击另外的文本时,我需要使按钮完全可见并停止 onMouseLeave
我有ul标签内 div标签。我申请了mouseup事件 div标记和 click事件 ul标签。 问题 每当我点击 ul标签,然后都是 mouseup和 click事件被触发。 我想要的是当我点击 u
我是 Javascript 和 jQuery 的新手,所以我有一个非常愚蠢的疑问,请耐心等待 $(document).click(function () { alert("!"); v
我有一个邮政编码解析器,我正在使用 keyup 事件处理程序来跟踪输入长度何时达到 5,然后查询服务器以解析邮政编码。但是我想防止脚本被不必要地调用,所以我想知道是否有一种方法可以跟踪 keydown
使用事件 API,我有以下代码来发布带有事件照片的事件 $facebook = new Facebook(array( "appId" => "XXX", "se
首次加载 Microsoft Word 时,既不会触发 NewDocument 事件也不会触发 DocumentOpen 事件。当 Word 实例已打开并打开新文档或现有文档时,这些事件会正常触发。
我发现了很多相关问题(这里和其他地方),但还没有具体找到这个问题。 我正在尝试监听箭头键 (37-40) 的按键事件,但是当以特定顺序使用箭头键时,后续箭头不会生成“按键”事件。 例子: http:/
给定的 HTML: 和 JavaScript 的: var $test = $('#test'); $test.on('keydown', function(event) { if (eve
我是 Node.js 的新手,希望使用流运行程序。对于其他程序,我必须同时启动一个服务器(mongodb、redis 等),但我不知道我是否应该用这个运行一个服务器。请让我知道我哪里出了问题以及如何纠
我正在尝试使用 Swift 和 Cocoa 创建一个适用于 OS X 的应用程序。我希望应用程序能够响应关键事件,而不将焦点放在文本字段上/文本字段中。我在 Xcode 中创建了一个带有 Storyb
我有以下代码: (function(w,d,s,l,i){ w[l]=w[l]||[];w[l].push({
我是一名优秀的程序员,十分优秀!