- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试根据条件合并两个 csv。 csv2 上的值“KEYS”必须与 CSV1 上的“TCNUM”匹配,并将其附加到第三列。 csv 非常大,必须通过代码完成。
df1 - CSV1:
ID TC_NUM
dialog_testcase_0101.0001_greeting.xml 101.0001
dialog_testcase_0101.0002_greeting.xml 101.0002
dialog_testcase_0101.0003_greeting.xml 101.0003
dialog_testcase_0101.0004_greeting.xml 101.0004
dialog_testcase_0101.0005_greeting.xml 101.0005
dialog_testcase_0101.0006_greeting.xml 101.0006
dialog_testcase_0901.0008_greeting.xml 901.0007
dialog_testcase_0101.0008_greeting.xml 101.0008
dialog_testcase_0501.001_greeting.xml 501.001
dialog_testcase_0801.0011_greeting.xml 801.0011
df2 - CSV2:
KEYS TC_NUM
FIT-3982 TC 101.0011, 101.0004
FIT-3980 TC 801.0011.901.007
FIT-3979 TC 101.0006, 501.001, 1907.0019, 1907.0020, 1907.0021
我想要什么:
csv最终:
ID TC_NUM Keys
dialog_testcase_0101.0001_greeting.xml 101.0011 FIT-3982
dialog_testcase_0101.0002_greeting.xml 101.0002
dialog_testcase_0101.0003_greeting.xml 101.0006 FIT_3979
dialog_testcase_0101.0004_greeting.xml 101.0004 FIT-3982
dialog_testcase_0101.0005_greeting.xml 101.0005
dialog_testcase_0101.0006_greeting.xml 101.0011 FIT_3982
dialog_testcase_0901.0008_greeting.xml 901.0007 FIT_3979
dialog_testcase_0101.0008_greeting.xml 101.0008
dialog_testcase_0501.001_greeting.xml 501.001 FIT-3979
dialog_testcase_0801.0011_greeting.xml 801.0011 FIT-3980
我的代码..
mergedOpen = pd.merge(df1, df2, on=['TC_NUM'])
mergedOpen.set_index('TC_NUM', inplace=True)
mergedOpen.to_csv('MergedCSVOPEN.csv')
最佳答案
您可以在set_index
之后从列 TC_NUM
中删除第一个 3
字符,split
通过 ,
和 unstack
和 reset_index
为merge
创建新的DataFrame
。两列 TC_NUM
都必须设置为等于 dtype
- string
或 numeric
。我选择数字
,因此我转换列df2.TC_NUM
to_numeric
:
df2.set_index('KEYS',inplace=True)
df2 = df2.TC_NUM.str[3:]
.str.split(', ', expand=True)
.unstack()
.reset_index(drop=True, level=0)
.reset_index(name='TC_NUM')
df2['TC_NUM'] = pd.to_numeric(df2['TC_NUM'])
print (df2)
KEYS TC_NUM
0 FIT-3982 101.0011
1 FIT-3980 801.0011
2 FIT-3979 101.0006
3 FIT-3982 101.0004
4 FIT-3980 901.0070
5 FIT-3979 501.0010
6 FIT-3982 NaN
7 FIT-3980 NaN
8 FIT-3979 1907.0019
9 FIT-3982 NaN
10 FIT-3980 NaN
11 FIT-3979 1907.0020
12 FIT-3982 NaN
13 FIT-3980 NaN
14 FIT-3979 1907.0021
mergedOpen = pd.merge(df1, df2, on='TC_NUM', how='left')
print (mergedOpen)
ID TC_NUM KEYS
0 dialog_testcase_0101.0001_greeting.xml 101.0001 NaN
1 dialog_testcase_0101.0002_greeting.xml 101.0002 NaN
2 dialog_testcase_0101.0003_greeting.xml 101.0003 NaN
3 dialog_testcase_0101.0004_greeting.xml 101.0004 FIT-3982
4 dialog_testcase_0101.0005_greeting.xml 101.0005 NaN
5 dialog_testcase_0101.0006_greeting.xml 101.0006 FIT-3979
6 dialog_testcase_0901.0008_greeting.xml 901.0007 NaN
7 dialog_testcase_0101.0008_greeting.xml 101.0008 NaN
8 dialog_testcase_0501.001_greeting.xml 501.0010 FIT-3979
9 dialog_testcase_0801.0011_greeting.xml 801.0011 FIT-3980
mergedOpen.set_index('TC_NUM', inplace=True)
mergedOpen.to_csv('MergedCSVOPEN.csv')
关于Python Pandas 如果数字相等则合并,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37310141/
也许我在 Java 上工作的时间太长而没有真正理解它的一些基础知识。 我确实理解 == 用于对象引用相等,而 .equals() 用于对象值相等。 比较整数: Integer x = 1, y = 1
我是从一道考试题中得出这个答案的,但无法理解该解决方案的工作原理。如果值“x”和“y”相等,则此函数应该返回“true”,否则返回 False。 解决方法: function equal_boolea
我将带有表情符号的文本存储在 mysql 数据库中。 数据库、表和列设置为使用utf8mb4和utf8mb4_unicode_ci。 我可以毫无问题地输入单元格值(数据类型是 VARCHAR)。 但是
如果两个 DateTime 对象具有相同的日、月和年,我该如何比较?问题是他们有不同的小时/分钟/秒。 最佳答案 对于 DateTime 对象,没有好的方法可以做到这一点。所以你必须做,比方说,不是那
我一直想知道这个问题,所以我想我会问的。 您将看到的大多数地方都使用相同的语义逻辑来覆盖 Equals 和 GetHashCode 以实现成员平等...但是它们通常使用不同的实现: publi
苹果 CoreGraphics.framework , CGGeometry.h : CG_INLINE bool __CGSizeEqualToSize(CGSize size1, CGSize s
在最新的python 版本中, dict 保留了插入的顺序。在平等方面是否有任何变化。例如,目前以下工作。既然广告顺序很重要, future 会不会发生这种变化? 我问是因为有根本性的变化 - 以前
class VideoUserModel(models.Model): user = models.ManyToManyField(get_user_model()) viewlist
我在 COQ 中有一个有限枚举类型(比如 T),我想检查元素是否相等。这意味着,我需要一个函数 bool beq_T(x:T,y:T) 我设法定义这样一个函数的唯一方法是逐个分析。这会导致很多匹配语
我在 Windows 7(32 位)下的 MinGW 中使用 gfortran 来编译 Fortran 代码。这是文件 testequal.f 中包含的最少代码: program test
我有以下 jsp 片段: ${campaign.moderated}
我想检查两个稀疏数组是否(几乎)相等。而对于 numpy 数组,你可以这样做: import numpy as np a = np.ones(200) np.testing.assert_array_
我有以下类(class): public class MyDocuments { public DateTime registeredDate; public
这个问题已经有答案了: Is floating point math broken? (33 个回答) 已关闭 5 年前。 我在这里想做的是,我采用一个精度值(小于 1)并打印 1/n 类型的所有数字
我正在为我的arduino写一个草图,我想检查我的字符串的最后一个字符。 例如: 如果输入是 cats- 我想看看最后一个字符(在我的例子中是“-”)实际上是否 - 我使用的代码: 串行事件函数 vo
让我们开始: using System; public class Program { class A { public virtual void Do() { }
我只需要根据几个键(不是全部)来确定两个 HashMap 的相等性 除了单独访问每个字段并比较相等性之外,还有其他节省时间的方法吗? 最佳答案 我能想到的一种方法是在您的 HashMap 上存储某种“
在Java中,大写的Double可以为null。 但是如果我有 double a 和 b 并且我这样做: if (a.equals(b)) 如果其中之一为空,它会崩溃。有没有更好的方法来比较它们? 最
我正在尝试从我的旧数据库中插入表格数据。 Id 在数据库表和选择特定列中都相等。这是我的数据库。 旧数据库:sch -> 旧表:product (id, tag, url) (13, red, aaa
我正在开发一个应用程序,它在我的主视图中有一个侧边栏和两个 div。我试图在容器内平均分割两者的高度。我试过 height = 50% 但效果不太好。
我是一名优秀的程序员,十分优秀!