python - 组合 Groupby 功能代码(带和不带 grouper)-6ren

python - 组合 Groupby 功能代码(带和不带 grouper)

转载作者：行者123 更新时间：2023-12-01 00:38:32

24

4

我在我的数据集上编写了这两个 groupby 函数，第一个函数对我的数据进行分组，并将数据的日期时间分隔为开始日期时间、结束日期时间。

这是数据集:

Blast Hole	East Coordinate	North Coordinate	Collar	Theoritical Depth	Tag Detector ID	Date and Time	Detection_Location	Detection Date & Time
64	16745.42	107390.32	2634.45	15.95	385656531	23-08-2018 2:39:34 PM	CV23	2018-09-08 14:18:17
61	16773.48	107382.6	2634.68	16.18	385760755	23-08-2018 2:38:32 PM	CV23	2018-09-08 14:24:19
63	16755.07	107387.68	2634.58	16.08	385262370	23-08-2018 2:39:30 PM	CV23	2018-09-08 14:12:42
105	16764.83	107347.67	2634.74	16.24	385742468	23-08-2018 2:41:29 PM	CV22	2018-09-06 20:02:46
100	16752.74	107360.32	2634.33	15.83	385112050	23-08-2018 2:41:08 PM	CV22	2018-09-06 20:15:42
99	16743.1	107362.96	2634.36	15.86	385087366	23-08-2018 2:41:05 PM	CV22	2018-09-06 20:49:21
35	16747.75	107417.68	2635.9	17.4	385453358	23-08-2018 2:36:09 PM	CV22	2018-09-23 05:47:44
5	16757.27	107452.4	2636	17.5	385662254	23-08-2018 2:35:03 PM	CV22	2018-09-23 05:01:12
19	16770.89	107420.83	2634.81	16.31	385826979	23-08-2018 2:35:50 PM	CV22	2018-09-23 05:52:54

第二部分帮助我像以前一样将分组数据框中的所有列保留为逗号分隔。

我面临着如何将这两个代码组合成一个代码并执行操作的问题:


df2 = (df1.groupby([pd.Grouper(key = 'Detection Date & Time', freq = 'H'),df.Detection_Location])
      ['Detection Date & Time'].agg(['first','last','size'])).reset_index()

df2 = df1.groupby("Detection date & Hour").agg({
        'Blast Hole': lambda x: ','.join([str(n) for n in x]),
        'East Coordinate': lambda x: ','.join([str(n) for n in x]),
        'North Coordinate': lambda x: ','.join([str(n) for n in x]),
        'Tag Detector ID': lambda x: ','.join([str(n) for n in x]),
        'Detection_Location': lambda x: min(x),
        'Detection Date & Time' : lambda x: len(x)}).reset_index().rename(columns = {'Detection Date & Time' : 'Tags'})

这是期望的结果:

Detection_Location_	first	last	size	Blast Hole	East Coordinate	North Coordinate	Tag Detector ID
CV22	2018-09-06 20:02:46	2018-09-06 20:49:21	3	105,100,99	16764.83,16752.74,16743.1	107347.67,107360.32,107362.96	385742468,385112050,385087366
CV23	2018-09-08 14:12:42	2018-09-08 14:24:19	3	64,61,63	16745.42,16773.48,16755.07	107390.32,107382.6,107387.68	385656531,385760755,385262370
CV22	2018-09-23 05:01:12	2018-09-23 05:52:54	3	35,5,19	16747.75,16757.27,16770.89	107417.68,107452.4,107420.83	385453358,385662254,385826979

谢谢

最佳答案

第一个想法是，groupby 中是否需要不同的值 - 第一个 df21 带有 Grouper，第二个仅带有 Grouper :

df1['Date and Time'] = pd.to_datetime(df1['Date and Time'])
df1['Detection Date & Time'] = pd.to_datetime(df1['Detection Date & Time'])


df21 = (df1.groupby([pd.Grouper(key = 'Detection Date & Time', freq = 'H'),
                     df1.Detection_Location])
      ['Detection Date & Time'].agg(['first','last','size']))
#print (df21)


f = lambda x: ','.join(x.astype(str))
df22=(df1.groupby(pd.Grouper(key = 'Detection Date & Time', freq = 'H')).agg({
        'Blast Hole': f,
        'East Coordinate': f,
        'North Coordinate': f,
        'Tag Detector ID': f,
        'Detection_Location': 'min',
        'Detection Date & Time' : 'size'})
        .dropna()
        .rename(columns = {'Detection Date & Time' : 'Tags'})
        .set_index('Detection_Location', append=True))

#print (df22)

<小时/>

df = pd.merge(df21, df22, left_index=True, right_index=True).reset_index()
print (df)
  Detection Date & Time Detection_Location               first  \
0   2018-09-06 20:00:00               CV22 2018-09-06 20:02:46   
1   2018-09-08 14:00:00               CV23 2018-09-08 14:18:17   
2   2018-09-23 05:00:00               CV22 2018-09-23 05:47:44   

                 last  size  Blast Hole             East Coordinate  \
0 2018-09-06 20:49:21     3  105,100,99   16764.83,16752.74,16743.1   
1 2018-09-08 14:12:42     3    63,64,61  16755.07,16745.42,16773.48   
2 2018-09-23 05:52:54     3     5,35,19  16757.27,16747.75,16770.89   

                North Coordinate                Tag Detector ID  Tags  
0  107347.67,107360.32,107362.96  385742468,385112050,385087366     3  
1   107387.68,107390.32,107382.6  385262370,385656531,385760755     3  
2   107452.4,107417.68,107420.83  385662254,385453358,385826979     3

编辑:

如果需要按Grouper和列一起分组:

df1['Date and Time'] = pd.to_datetime(df1['Date and Time'])
df1['Detection Date & Time'] = pd.to_datetime(df1['Detection Date & Time'])


f = lambda x: ','.join(x.astype(str))
df2=(df1.groupby([pd.Grouper(key='Detection Date & Time',freq='H'),
                 df1.Detection_Location]).agg({
        'Blast Hole': f,
        'East Coordinate': f,
        'North Coordinate': f,
        'Tag Detector ID': f,
        'Detection Date & Time' : ['first','last','size']})
               .reset_index()
               .rename(columns = {'Detection Date & Time' : '', '<lambda>':''}))

df2.columns = df2.columns.map(''.join)
df2 = df2.rename(columns = {'' : 'Detection Date & Time'})

<小时/>

print (df2)
  Detection Date & Time Detection_Location  Blast Hole  \
0   2018-09-06 20:00:00               CV22  105,100,99   
1   2018-09-08 14:00:00               CV23    64,61,63   
2   2018-09-23 05:00:00               CV22     35,5,19   

              East Coordinate               North Coordinate  \
0   16764.83,16752.74,16743.1  107347.67,107360.32,107362.96   
1  16745.42,16773.48,16755.07   107390.32,107382.6,107387.68   
2  16747.75,16757.27,16770.89   107417.68,107452.4,107420.83   

                 Tag Detector ID               first                last  size  
0  385742468,385112050,385087366 2018-09-06 20:02:46 2018-09-06 20:49:21     3  
1  385656531,385760755,385262370 2018-09-08 14:18:17 2018-09-08 14:12:42     3  
2  385453358,385662254,385826979 2018-09-23 05:47:44 2018-09-23 05:52:54     3

关于python - 组合 Groupby 功能代码(带和不带 grouper)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57550770/

24

4

0

文章推荐： mysql - sql获取上个月的所有查询

文章推荐： jquery - 在 jQuery 中为 $.post 调用分配回调

文章推荐： javascript - 检查输入是否错误

SQL ORDER BY 带 CASE 带 UNION ALL
运行 PostgreSQL(7.4 和 8.x)，我认为这是可行的，但现在我遇到了错误。我可以单独运行查询，它工作得很好，但如果我使用 UNION 或 UNION ALL，它会抛出错误。这个错误:
java - 带 fragment 的抽屉导航(带 ViewPager)重新打开时消失
我试图为我的应用程序创建一个导航，使用抽屉导航我的 fragment 之一(HomeFragment)有一个 ViewPager，可容纳 3 个 fragment (Bundy Clock、Annou
android - 带 Activity 的抽屉导航和。带 fragment 的抽屉导航
以我目前正在开发的应用为例: - 它有一个包含多个项目的抽屉导航；现在有两个项目让我感兴趣，我将它们称为 X 和 Y。 X 和 Y 都在单击时显示包含 x 元素或 y 元素列表的 fragment 选
python - 如何将形状为(带、行、列)的数组重新整形为(行、列、带)？
我有一个形状为 (370,275,210) 的 NumPy 数组，我想将其重新整形为 (275,210,370)。我将如何在 Python 中实现这一点？ 370是波段数，275是行数，210是图像包
iphone - 无法与具有子 UIViewController(带 NIB)的父 UIViewController(带 NIB)交互
我们如何与被子 UIViewController 阻止的父 UIViewController(具有按钮)交互。显然，触摸事件不会通过子 Nib 。 (启用用户交互) 注意:我正在加载默认和自定义 NI
java - storeedProcedure.registerStoredProcedureParameter，带 out Parameter ref 光标，带 Jpa Eclipse Link
我是 Jpa 新手，我想执行过程我的代码如下 private static final String PERSISTENCE_UNIT_NAME = "todos"; private static
google-compute-engine - 带 LAMP 的 GCE VS 带 Cloud SQL 的 GCE
与安装了 LAMP 的 GCE 相比，选择与 Google Cloud SQL 链接的 GCE 实例有哪些优势？我确定 GCE 是可扩展的，但是安装在其上的 mysql 数据库的可扩展性如何？使用
带*点和不带指针的Golang类型方法？
这个问题在这里已经有了答案: Value receiver vs. pointer receiver (3 个答案) 关闭 3 年前。我刚接触 golang。只是想了解为 Calc 类型声明的两种
R - 日期和分界线的快捷方式，带# -----
我不小心按了一个快捷键，一个非常漂亮的断线出现在日期上。有点像 # 23 Jun 2010 -------------------- 有人知道有问题的快捷方式吗？？ (我在 mac 上工作!) 在
scala - 带$和字符串插值的Scala正则表达式
我正在Scala中编写正则表达式 val regex = "^foo.*$".r 这很好，但是如果我想做 var x = "foo" val regex = s"""^$x.*$""".r 现在我们有
带/不带命名空间的 XML
以下 XML 文档在技术上是否相同？ James Dean 19 和: James Dean 19 最佳答案这两个文档在语义上是相同的。在 X
带 lapply 的稳健线性回归
我在对数据帧列表运行稳健的线性回归模型(使用 MASS 库中的 rlm)时遇到问题。可重现的示例: var1 <- c(1:100) var2 <- var1*var1 df1 <- data.f
iphone - 带 $ 符号的自定义数字键盘
好的，我有一个自定义数字键盘，可以在标签(numberField)中将数字显示为 0.00，现在我需要它显示 $0.00。 NSString *digit = sender.currentTitle;
macos - 带 Storyboard的基于文档的应用程序自动保存
在基于文档的应用程序中，使用 XIB 文件，创建新窗口时其行为是: 根据最后一个事件的位置进行定位和调整大小 window 。如果最后一个事件窗口仍然可见，则新窗口窗口应该是级联的，这样它就不会直
sql - 带 in 子句的查询中的参数？
我想使用参数进行查询，如下所示: SELECT * FROM MATABLE WHERE MT_ID IN (368134, 181956) 所以我考虑一下 SELECT * FROM MATABLE
sql - 带/不带参数的性能问题
我遇到一些性能问题。我有一个大约有 200 万行的表。 CREATE TABLE [dbo].[M8]( [M8_ID] [int] IDENTITY(1,1) NOT NULL,
javascript - 带 (+) 键的按键功能不起作用
我在 jquery 中的按键功能遇到问题。我不知道为什么按键功能不起作用。我已经使用了正确的 key 代码。在我的函数中有 2 个代码，其中包含 2 个事件键，按一个键表示 (+) 代码 107 和(
android - 带.raw输入的音频波形
我想显示音频波形，我得到了此代码，它需要.raw音频输入并显示音频波形，但是当我放入.3gp，.mp3音频时，我得到白噪声，有人可以帮助我如何使其按需与.3gp一起使用使用.3gp音频运行它。 Inp
php - 带$的stristr
我无法让 stristr 函数返回真值，我相信这是因为我的搜索中有一个 $ 字符。当我这样做时: var_dump($nopricecart); 完整的 $nopricecart 值是 $0 ，我得
algorithm - 带 If 语句的循环的时间复杂度
如果我有这样的循环: for(int i=0;i O(n) 次。所以do some执行了O(n)次。如果做某事是线性时间，那么代码片段的复杂度是O(n^2)。关于algorithm - 带 If 语

首页

博学

6Ren·AI

商城

python - 组合 Groupby 功能代码(带和不带 grouper)