- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在我的数据集上编写了这两个 groupby 函数,第一个函数对我的数据进行分组,并将数据的日期时间分隔为开始日期时间、结束日期时间。
这是数据集:
Blast Hole East Coordinate North Coordinate Collar Theoritical Depth Tag Detector ID Date and Time Detection_Location Detection Date & Time
64 16745.42 107390.32 2634.45 15.95 385656531 23-08-2018 2:39:34 PM CV23 2018-09-08 14:18:17
61 16773.48 107382.6 2634.68 16.18 385760755 23-08-2018 2:38:32 PM CV23 2018-09-08 14:24:19
63 16755.07 107387.68 2634.58 16.08 385262370 23-08-2018 2:39:30 PM CV23 2018-09-08 14:12:42
105 16764.83 107347.67 2634.74 16.24 385742468 23-08-2018 2:41:29 PM CV22 2018-09-06 20:02:46
100 16752.74 107360.32 2634.33 15.83 385112050 23-08-2018 2:41:08 PM CV22 2018-09-06 20:15:42
99 16743.1 107362.96 2634.36 15.86 385087366 23-08-2018 2:41:05 PM CV22 2018-09-06 20:49:21
35 16747.75 107417.68 2635.9 17.4 385453358 23-08-2018 2:36:09 PM CV22 2018-09-23 05:47:44
5 16757.27 107452.4 2636 17.5 385662254 23-08-2018 2:35:03 PM CV22 2018-09-23 05:01:12
19 16770.89 107420.83 2634.81 16.31 385826979 23-08-2018 2:35:50 PM CV22 2018-09-23 05:52:54
第二部分帮助我像以前一样将分组数据框中的所有列保留为逗号分隔。
我面临着如何将这两个代码组合成一个代码并执行操作的问题:
df2 = (df1.groupby([pd.Grouper(key = 'Detection Date & Time', freq = 'H'),df.Detection_Location])
['Detection Date & Time'].agg(['first','last','size'])).reset_index()
df2 = df1.groupby("Detection date & Hour").agg({
'Blast Hole': lambda x: ','.join([str(n) for n in x]),
'East Coordinate': lambda x: ','.join([str(n) for n in x]),
'North Coordinate': lambda x: ','.join([str(n) for n in x]),
'Tag Detector ID': lambda x: ','.join([str(n) for n in x]),
'Detection_Location': lambda x: min(x),
'Detection Date & Time' : lambda x: len(x)}).reset_index().rename(columns = {'Detection Date & Time' : 'Tags'})
这是期望的结果:
Detection_Location_ first last size Blast Hole East Coordinate North Coordinate Tag Detector ID
CV22 2018-09-06 20:02:46 2018-09-06 20:49:21 3 105,100,99 16764.83,16752.74,16743.1 107347.67,107360.32,107362.96 385742468,385112050,385087366
CV23 2018-09-08 14:12:42 2018-09-08 14:24:19 3 64,61,63 16745.42,16773.48,16755.07 107390.32,107382.6,107387.68 385656531,385760755,385262370
CV22 2018-09-23 05:01:12 2018-09-23 05:52:54 3 35,5,19 16747.75,16757.27,16770.89 107417.68,107452.4,107420.83 385453358,385662254,385826979
最佳答案
第一个想法是,groupby
中是否需要不同的值 - 第一个 df21
带有 Grouper
,第二个仅带有 Grouper
:
df1['Date and Time'] = pd.to_datetime(df1['Date and Time'])
df1['Detection Date & Time'] = pd.to_datetime(df1['Detection Date & Time'])
df21 = (df1.groupby([pd.Grouper(key = 'Detection Date & Time', freq = 'H'),
df1.Detection_Location])
['Detection Date & Time'].agg(['first','last','size']))
#print (df21)
f = lambda x: ','.join(x.astype(str))
df22=(df1.groupby(pd.Grouper(key = 'Detection Date & Time', freq = 'H')).agg({
'Blast Hole': f,
'East Coordinate': f,
'North Coordinate': f,
'Tag Detector ID': f,
'Detection_Location': 'min',
'Detection Date & Time' : 'size'})
.dropna()
.rename(columns = {'Detection Date & Time' : 'Tags'})
.set_index('Detection_Location', append=True))
#print (df22)
<小时/>
df = pd.merge(df21, df22, left_index=True, right_index=True).reset_index()
print (df)
Detection Date & Time Detection_Location first \
0 2018-09-06 20:00:00 CV22 2018-09-06 20:02:46
1 2018-09-08 14:00:00 CV23 2018-09-08 14:18:17
2 2018-09-23 05:00:00 CV22 2018-09-23 05:47:44
last size Blast Hole East Coordinate \
0 2018-09-06 20:49:21 3 105,100,99 16764.83,16752.74,16743.1
1 2018-09-08 14:12:42 3 63,64,61 16755.07,16745.42,16773.48
2 2018-09-23 05:52:54 3 5,35,19 16757.27,16747.75,16770.89
North Coordinate Tag Detector ID Tags
0 107347.67,107360.32,107362.96 385742468,385112050,385087366 3
1 107387.68,107390.32,107382.6 385262370,385656531,385760755 3
2 107452.4,107417.68,107420.83 385662254,385453358,385826979 3
编辑:
如果需要按Grouper
和列一起分组:
df1['Date and Time'] = pd.to_datetime(df1['Date and Time'])
df1['Detection Date & Time'] = pd.to_datetime(df1['Detection Date & Time'])
f = lambda x: ','.join(x.astype(str))
df2=(df1.groupby([pd.Grouper(key='Detection Date & Time',freq='H'),
df1.Detection_Location]).agg({
'Blast Hole': f,
'East Coordinate': f,
'North Coordinate': f,
'Tag Detector ID': f,
'Detection Date & Time' : ['first','last','size']})
.reset_index()
.rename(columns = {'Detection Date & Time' : '', '<lambda>':''}))
df2.columns = df2.columns.map(''.join)
df2 = df2.rename(columns = {'' : 'Detection Date & Time'})
<小时/>
print (df2)
Detection Date & Time Detection_Location Blast Hole \
0 2018-09-06 20:00:00 CV22 105,100,99
1 2018-09-08 14:00:00 CV23 64,61,63
2 2018-09-23 05:00:00 CV22 35,5,19
East Coordinate North Coordinate \
0 16764.83,16752.74,16743.1 107347.67,107360.32,107362.96
1 16745.42,16773.48,16755.07 107390.32,107382.6,107387.68
2 16747.75,16757.27,16770.89 107417.68,107452.4,107420.83
Tag Detector ID first last size
0 385742468,385112050,385087366 2018-09-06 20:02:46 2018-09-06 20:49:21 3
1 385656531,385760755,385262370 2018-09-08 14:18:17 2018-09-08 14:12:42 3
2 385453358,385662254,385826979 2018-09-23 05:47:44 2018-09-23 05:52:54 3
关于python - 组合 Groupby 功能代码(带和不带 grouper),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57550770/
运行 PostgreSQL(7.4 和 8.x),我认为这是可行的,但现在我遇到了错误。 我可以单独运行查询,它工作得很好,但如果我使用 UNION 或 UNION ALL,它会抛出错误。 这个错误:
我试图为我的应用程序创建一个导航,使用抽屉导航我的 fragment 之一(HomeFragment)有一个 ViewPager,可容纳 3 个 fragment (Bundy Clock、Annou
以我目前正在开发的应用为例: - 它有一个包含多个项目的抽屉导航;现在有两个项目让我感兴趣,我将它们称为 X 和 Y。 X 和 Y 都在单击时显示包含 x 元素或 y 元素列表的 fragment 选
我有一个形状为 (370,275,210) 的 NumPy 数组,我想将其重新整形为 (275,210,370)。我将如何在 Python 中实现这一点? 370是波段数,275是行数,210是图像包
我们如何与被子 UIViewController 阻止的父 UIViewController(具有按钮)交互。显然,触摸事件不会通过子 Nib 。 (启用用户交互) 注意:我正在加载默认和自定义 NI
我是 Jpa 新手,我想执行过程 我的代码如下 private static final String PERSISTENCE_UNIT_NAME = "todos"; private static
与安装了 LAMP 的 GCE 相比,选择与 Google Cloud SQL 链接的 GCE 实例有哪些优势? 我确定 GCE 是可扩展的,但是安装在其上的 mysql 数据库的可扩展性如何? 使用
这个问题在这里已经有了答案: Value receiver vs. pointer receiver (3 个答案) 关闭 3 年前。 我刚接触 golang。只是想了解为 Calc 类型声明的两种
我不小心按了一个快捷键,一个非常漂亮的断线出现在日期上。 有点像 # 23 Jun 2010 -------------------- 有人知道有问题的快捷方式吗?? (我在 mac 上工作!) 在
我正在Scala中编写正则表达式 val regex = "^foo.*$".r 这很好,但是如果我想做 var x = "foo" val regex = s"""^$x.*$""".r 现在我们有
以下 XML 文档在技术上是否相同? James Dean 19 和: James Dean 19 最佳答案 这两个文档在语义上是相同的。在 X
我在对数据帧列表运行稳健的线性回归模型(使用 MASS 库中的 rlm)时遇到问题。 可重现的示例: var1 <- c(1:100) var2 <- var1*var1 df1 <- data.f
好的,我有一个自定义数字键盘,可以在标签(numberField)中将数字显示为 0.00,现在我需要它显示 $0.00。 NSString *digit = sender.currentTitle;
在基于文档的应用程序中,使用 XIB 文件,创建新窗口时其行为是: 根据最后一个事件的位置进行定位和调整大小 window 。 如果最后一个事件窗口仍然可见,则新窗口 窗口应该是级联的,这样它就不会直
我想使用参数进行查询,如下所示: SELECT * FROM MATABLE WHERE MT_ID IN (368134, 181956) 所以我考虑一下 SELECT * FROM MATABLE
我遇到一些性能问题。 我有一个大约有 200 万行的表。 CREATE TABLE [dbo].[M8]( [M8_ID] [int] IDENTITY(1,1) NOT NULL,
我在 jquery 中的按键功能遇到问题。我不知道为什么按键功能不起作用。我已经使用了正确的 key 代码。在我的函数中有 2 个代码,其中包含 2 个事件键,按一个键表示 (+) 代码 107 和(
我想显示音频波形,我得到了此代码,它需要.raw音频输入并显示音频波形,但是当我放入.3gp,.mp3音频时,我得到白噪声,有人可以帮助我如何使其按需与.3gp一起使用使用.3gp音频运行它。 Inp
我无法让 stristr 函数返回真值,我相信这是因为我的搜索中有一个 $ 字符。 当我这样做时: var_dump($nopricecart); 完整的 $nopricecart 值是 $0 ,我得
如果我有这样的循环: for(int i=0;i O(n) 次。所以do some执行了O(n)次。如果做某事是线性时间,那么代码片段的复杂度是O(n^2)。 关于algorithm - 带 If 语
我是一名优秀的程序员,十分优秀!