python - 如何根据带条件的列值在数据框中插入行？-6ren

python - 如何根据带条件的列值在数据框中插入行？

转载作者：太空宇宙更新时间：2023-11-03 12:53:52

24

4

我有一个大约 20k 行的 DataFrame，看起来像这样:

import pandas as pd
import numpy as np
df = pd.DataFrame({'Car_ID': ['B332', 'B332', 'B332', 'C315', 'C315', 'C315', 'C315', 'C315', 'F310', 'F310'], \
                    'Date': ['2018-03-12', '2018-03-14', '2018-03-15', '2018-03-17', '2018-03-13', '2018-03-15', \
                             '2018-03-18', '2018-03-21', '2018-03-10', '2018-03-13'], \
                    'Driver': ['Alex', 'Alex', 'Mick', 'Sara', 'Sara', 'Jean', 'Sara', 'Sara', 'Franck','Michel']})
df

Out:    
    Car_ID  Date        Driver
0   B332    2018-03-12  Alex
1   B332    2018-03-14  Alex
2   B332    2018-03-15  Mick
3   C315    2018-03-17  Sara
4   C315    2018-03-13  Sara
5   C315    2018-03-15  Jean
6   C315    2018-03-18  Sara
7   C315    2018-03-21  Sara
8   F310    2018-03-10  Franck
9   F310    2018-03-13  Michel

我像这样为数据框中的每个事件创建一个新列:

df["Event"] = np.where(df.Car_ID.str.contains('B', case=True, na=False), 'Rent_Car_B', \
                    np.where(df.Car_ID.str.contains('C', case=True, na=False), 'Rent_Car_C', \
                    np.where(df.Car_ID.str.contains('F', case=True, na=False), 'Rent_Car_F', df.Car_ID))) 
df

Out:
    Car_ID  Date        Driver  Event
0   B332    2018-03-12  Alex    Rent_Car_B
1   B332    2018-03-14  Alex    Rent_Car_B
2   B332    2018-03-15  Mick    Rent_Car_B
3   C315    2018-03-17  Sara    Rent_Car_C
4   C315    2018-03-13  Sara    Rent_Car_C
5   C315    2018-03-15  Jean    Rent_Car_C
6   C315    2018-03-18  Sara    Rent_Car_C
7   C315    2018-03-21  Sara    Rent_Car_C
8   F310    2018-03-10  Franck  Rent_Car_F
9   F310    2018-03-13  Michel  Rent_Car_F

对于我的 Event 列，我想为每个驱动程序更改添加新行，如下所示:

Out:
    Car_ID  Date        Driver  Event
0   B332    2018-03-12  Alex    Rent_Car_B
1   B332    2018-03-14  Alex    Rent_Car_B
2   B332    2018-03-15  Mick    Rent_Car_B
3   B332    2018-03-15          Alex to Mick
4   C315    2018-03-17  Sara    Rent_Car_C
5   C315    2018-03-13  Sara    Rent_Car_C
6   C315    2018-03-15  Jean    Rent_Car_C
7   C315    2018-03-15          Sara to Jean
8   C315    2018-03-18  Sara    Rent_Car_C
9   C315    2018-03-18          Jean to Sara
10  C315    2018-03-21  Sara    Rent_Car_C
11  F310    2018-03-10  Franck  Rent_Car_F
12  F310    2018-03-13  Michel  Rent_Car_F
13  F310    2018-03-13          Franck to Mike

我不确定是否有一些技巧可以实现这项工作。我会很感激你的建议!

最佳答案

使用 shift 方法并首先用它创建一个我们将在之后使用的列:

df['Driver_shift'] = df['Driver'].shift()

选择您实际更换司机的行和与掩码相同的car_ID:

mask = (df['Driver'] != df['Driver_shift'])&(df['Car_ID'] == df['Car_ID'].shift())
df_change = df[mask]

现在，为了后面的拼接和排序，改变索引增加0.5，改变两列的值:

df_change = df_change.set_index(df_change.index+0.5)
df_change.loc[:,'Event'] = df_change['Driver_shift'] + ' to ' + df_change['Driver']
df_change['Driver'] = '' # to replace the value

现在您可以连接、排序、重置索引和删除:

pd.concat([df,df_change]).sort_index().reset_index(drop=True).drop('Driver_shift',1)

你得到:

   Car_ID        Date  Driver             Event
0    B332  2018-03-12    Alex        Rent_Car_B
1    B332  2018-03-14    Alex        Rent_Car_B
2    B332  2018-03-15    Mick        Rent_Car_B
3    B332  2018-03-15              Alex to Mick
4    C315  2018-03-17    Sara        Rent_Car_C
5    C315  2018-03-13    Sara        Rent_Car_C
6    C315  2018-03-15    Jean        Rent_Car_C
7    C315  2018-03-15              Sara to Jean
8    C315  2018-03-18    Sara        Rent_Car_C
9    C315  2018-03-18              Jean to Sara
10   C315  2018-03-21    Sara        Rent_Car_C
11   F310  2018-03-10  Franck        Rent_Car_F
12   F310  2018-03-13  Michel        Rent_Car_F
13   F310  2018-03-13          Franck to Michel

编辑:在每个驱动程序和日期之前添加一行

df1 = df.copy()
df1.index = df1.index +0.5
df2 = pd.concat([df.drop('Event',1),df1]).sort_index().reset_index(drop=True)
df2['Event'] = df2['Event'].fillna(df2['Driver'])

结果在df2中

关于python - 如何根据带条件的列值在数据框中插入行？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50910334/

24

4

0

文章推荐： android - 有没有办法获取android "history"系统日志？

文章推荐： apache - 当 X-Forwarded-Proto 为 http 时取消设置 HTTPS 环境变量

SQL ORDER BY 带 CASE 带 UNION ALL
运行 PostgreSQL(7.4 和 8.x)，我认为这是可行的，但现在我遇到了错误。我可以单独运行查询，它工作得很好，但如果我使用 UNION 或 UNION ALL，它会抛出错误。这个错误:
java - 带 fragment 的抽屉导航(带 ViewPager)重新打开时消失
我试图为我的应用程序创建一个导航，使用抽屉导航我的 fragment 之一(HomeFragment)有一个 ViewPager，可容纳 3 个 fragment (Bundy Clock、Annou
android - 带 Activity 的抽屉导航和。带 fragment 的抽屉导航
以我目前正在开发的应用为例: - 它有一个包含多个项目的抽屉导航；现在有两个项目让我感兴趣，我将它们称为 X 和 Y。 X 和 Y 都在单击时显示包含 x 元素或 y 元素列表的 fragment 选
python - 如何将形状为(带、行、列)的数组重新整形为(行、列、带)？
我有一个形状为 (370,275,210) 的 NumPy 数组，我想将其重新整形为 (275,210,370)。我将如何在 Python 中实现这一点？ 370是波段数，275是行数，210是图像包
iphone - 无法与具有子 UIViewController(带 NIB)的父 UIViewController(带 NIB)交互
我们如何与被子 UIViewController 阻止的父 UIViewController(具有按钮)交互。显然，触摸事件不会通过子 Nib 。 (启用用户交互) 注意:我正在加载默认和自定义 NI
java - storeedProcedure.registerStoredProcedureParameter，带 out Parameter ref 光标，带 Jpa Eclipse Link
我是 Jpa 新手，我想执行过程我的代码如下 private static final String PERSISTENCE_UNIT_NAME = "todos"; private static
google-compute-engine - 带 LAMP 的 GCE VS 带 Cloud SQL 的 GCE
与安装了 LAMP 的 GCE 相比，选择与 Google Cloud SQL 链接的 GCE 实例有哪些优势？我确定 GCE 是可扩展的，但是安装在其上的 mysql 数据库的可扩展性如何？使用
带*点和不带指针的Golang类型方法？
这个问题在这里已经有了答案: Value receiver vs. pointer receiver (3 个答案) 关闭 3 年前。我刚接触 golang。只是想了解为 Calc 类型声明的两种
R - 日期和分界线的快捷方式，带# -----
我不小心按了一个快捷键，一个非常漂亮的断线出现在日期上。有点像 # 23 Jun 2010 -------------------- 有人知道有问题的快捷方式吗？？ (我在 mac 上工作!) 在
scala - 带$和字符串插值的Scala正则表达式
我正在Scala中编写正则表达式 val regex = "^foo.*$".r 这很好，但是如果我想做 var x = "foo" val regex = s"""^$x.*$""".r 现在我们有
带/不带命名空间的 XML
以下 XML 文档在技术上是否相同？ James Dean 19 和: James Dean 19 最佳答案这两个文档在语义上是相同的。在 X
带 lapply 的稳健线性回归
我在对数据帧列表运行稳健的线性回归模型(使用 MASS 库中的 rlm)时遇到问题。可重现的示例: var1 <- c(1:100) var2 <- var1*var1 df1 <- data.f
iphone - 带 $ 符号的自定义数字键盘
好的，我有一个自定义数字键盘，可以在标签(numberField)中将数字显示为 0.00，现在我需要它显示 $0.00。 NSString *digit = sender.currentTitle;
macos - 带 Storyboard的基于文档的应用程序自动保存
在基于文档的应用程序中，使用 XIB 文件，创建新窗口时其行为是: 根据最后一个事件的位置进行定位和调整大小 window 。如果最后一个事件窗口仍然可见，则新窗口窗口应该是级联的，这样它就不会直
sql - 带 in 子句的查询中的参数？
我想使用参数进行查询，如下所示: SELECT * FROM MATABLE WHERE MT_ID IN (368134, 181956) 所以我考虑一下 SELECT * FROM MATABLE
sql - 带/不带参数的性能问题
我遇到一些性能问题。我有一个大约有 200 万行的表。 CREATE TABLE [dbo].[M8]( [M8_ID] [int] IDENTITY(1,1) NOT NULL,
javascript - 带 (+) 键的按键功能不起作用
我在 jquery 中的按键功能遇到问题。我不知道为什么按键功能不起作用。我已经使用了正确的 key 代码。在我的函数中有 2 个代码，其中包含 2 个事件键，按一个键表示 (+) 代码 107 和(
android - 带.raw输入的音频波形
我想显示音频波形，我得到了此代码，它需要.raw音频输入并显示音频波形，但是当我放入.3gp，.mp3音频时，我得到白噪声，有人可以帮助我如何使其按需与.3gp一起使用使用.3gp音频运行它。 Inp
php - 带$的stristr
我无法让 stristr 函数返回真值，我相信这是因为我的搜索中有一个 $ 字符。当我这样做时: var_dump($nopricecart); 完整的 $nopricecart 值是 $0 ，我得
algorithm - 带 If 语句的循环的时间复杂度
如果我有这样的循环: for(int i=0;i O(n) 次。所以do some执行了O(n)次。如果做某事是线性时间，那么代码片段的复杂度是O(n^2)。关于algorithm - 带 If 语

首页

博学

6Ren·AI

商城

python - 如何根据带条件的列值在数据框中插入行？