Python Pandas : Compare two CSV files and delete lines from both the file by matching a column-6ren

Python Pandas : Compare two CSV files and delete lines from both the file by matching a column

转载作者：行者123 更新时间：2023-12-01 08:46:35

25

4

如果第一列的值不存在于另一个文件中，我们需要从两个文件中删除行。

让我们考虑两个 CSV 文件:

file1.csv:
yrdi_391    111    1.11    1.0    1.1    111.0
yfyrn_9132  222    2.22    2.0    2.2    222.0
kdkfke_392  999    9.99    9.0    9.9    999.0
hfeisk_3    333    3.33    3.0    3.3    333.0

file2.csv:
yrdi_391    444    4.44    4.0    4.4    444.0
yfyrn_9132  555    5.55    5.0    5.5    555.0
hfeisk_3    666    6.66    6.0    6.6    666.0
fhedn_271   888    8.88    8.0    8.8    888.0

现在，我们需要从 file1.csv 中删除以 kdkfke_392 开头的整行，因为 file2.csv 中不存在该行。

另一方面，我们需要删除以 fhedn_271 开头的整行，因为它不存在于 file1.csv 中。

预期结果:

file1.csv:
yrdi_391    111    1.11    1.0    1.1    111.0
yfyrn_9132  222    2.22    2.0    2.2    222.0
hfeisk_3    333    3.33    3.0    3.3    333.0

file2.csv:
yrdi_391    444    4.44    4.0    4.4    444.0
yfyrn_9132  555    5.55    5.0    5.5    555.0
hfeisk_3    666    6.66    6.0    6.6    666.0

到目前为止，file1.csv 和 file2.csv 中的行尚未排序。如果需要，我们可以先进行排序，然后进行删除。

Pandas CVS 相关操作是首选，因为我们在这两个文件中都有标题并且需要保留它们。

Python 脚本新手!

任何帮助将不胜感激!

最佳答案

您可以使用isin() .

print (df)

            0    1     2    3    4      5
0    yrdi_391  111  1.11  1.0  1.1  111.0
1  yfyrn_9132  222  2.22  2.0  2.2  222.0
2  kdkfke_392  999  9.99  9.0  9.9  999.0
3    hfeisk_3  333  3.33  3.0  3.3  333.0

print (df1)

            0    1     2    3    4      5
0    yrdi_391  444  4.44  4.0  4.4  444.0
1  yfyrn_9132  555  5.55  5.0  5.5  555.0
2    hfeisk_3  666  6.66  6.0  6.6  666.0
3   fhedn_271  888  8.88  8.0  8.8  888.0

<小时/>

csv_df = df[df[0].isin(df1[0])]

print (csv_df)
            0    1     2    3    4      5
0    yrdi_391  111  1.11  1.0  1.1  111.0
1  yfyrn_9132  222  2.22  2.0  2.2  222.0
3    hfeisk_3  333  3.33  3.0  3.3  333.0

csv_df1 = df1[df1[0].isin(df[0])]

print (csv_df1)
            0    1     2    3    4      5
0    yrdi_391  444  4.44  4.0  4.4  444.0
1  yfyrn_9132  555  5.55  5.0  5.5  555.0
2    hfeisk_3  666  6.66  6.0  6.6  666.0

csv_df.to_csv('temp.csv', index=False)
csv_df1.to_csv('temp1.csv', index=False)

关于Python Pandas : Compare two CSV files and delete lines from both the file by matching a column，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53283531/

25

4

0

文章推荐： java - 在 CIDR 网络 block 中查找免费前缀

文章推荐： java - 如何在android studio中声明4d字符串数组？

文章推荐： java - JDBC 结果集类型滚动敏感

java - 将 Comparable 从 Comparator 转换为 Comparator？
我经常有一个 Comparator 类型，而我需要一个 Comparable 类型，反之亦然。是否有可重用的 JDK API 可以相互转换？类似的东西: public static Comp
java-8 - Comparator.compareBoolean() 和 Comparator.compare() 一样吗？
我怎么能写这个 Comparator sort = (i1, i2) -> Boolean.compare(i2.isOpen(), i1.isOpen()); 像这样(代码不起作用): Compa
java - 类型 new Comparator(){} 必须实现继承的抽象方法 Comparator.compare(Object, Object)
请帮助她。我有一个错误 Collections.sort(var4, new Comparator() { public int compare(TreeMap var1, TreeMa
java - Comparator.compare() 是如何工作的？
学习 Kotlin，我试图了解 Java 的 Comparator接口(interface)有效 - 主要是 compare() 函数，这样我就可以利用它。我已经尝试阅读 compare() 的文档
java - 如何编写 Comparator.comparing
我有以下程序 List numbers = Arrays.asList("10", "68", "97", "9", "21", "12"); Collections.sort(numbers, (
java - Comparator.comparing 使用嵌套对象的字段对列表进行排序
我想根据嵌套类的属性对如下所示的列表进行排序。 class Test { private NestedClass nestedClass; private AnotherNes
compare - Beyond Compare 软件算法如何工作？
我很好奇“Beyond Compare”的算法是如何工作的？我猜想他们使用了一种标准的(众所周知的？)算法来实现“字符与字符”的比较。你知道这个算法的名字吗？谢谢最佳答案 Beyond Compa
java - Comparable/Comparator 使用的排序的内部工作
这个问题已经有答案了: How does the sort() method of the Collection class call the Comparable's compareTo()? (1
Java : Comparable vs Comparator
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: difference between compare() and compareTo() Java: What i
java - 使用具有依赖性的 Comparable/Comparator
我被要求为某个类实现Comparable或Compartor，我们称之为V。假设我有一个 V 的 Collection 或 Set(还不确定，但我认为这并不重要)。 V 有一个方法，可以评估它的“权
java - Comparator.comparing 中的比较器和可序列化之间的按位与
我正在查看Java8中实现的Comparator.comparing方法的源代码这是代码 public static Comparator comparing( Function
java - Comparator#comparing 按类属性的属性排序
假设我有一个类 ClassA，它的属性是 ClassB: public ClassA { private String attr; private ClassB classB; } p
java - Comparator compare() 如何在内部为下面实现的方法工作？
我有一个自定义比较器，其比较逻辑如下: List l = new ArrayList(); l.add("tendercoupon"); l.add("giftcard
java - Comparator/Comparable/ComparatorChain问题
我正在努力实现一个处理 Comparator 和 Comparable 接口(interface)的层次结构。我不清楚的几件事: 如果我将比较器添加到比较器链中，这段代码究竟意味着什么 chain.a
Java Comparator.comparing 不比较？
正在关注 this question关于按另一个列表对列表进行排序，我尝试做同样的事情 - 但由于某种原因它对我不起作用。我错过了什么？ List nums = Arrays.asList(5
java - 嵌套字段的 Comparator.comparing(...)
假设我有一个像这样的领域模型: class Lecture { Course course; ... // getters } class Course { Teache
java - ">"和 ">>"之间的区别？
在表达式 > 中像这样的签名 public static > foo(T x) { ... } T的描述递归地依赖于Comparable . 如果T延伸Comparable ，和Comparable延
C# Comparer.Default.Compare 和 Comparer.Default 不返回 -1、0 或 1
所有“数字”比较器(例如 Comparer.Default 、 Comparer.Default 等)返回 -1 的原因是什么？ , 0或 1 ，但是 Comparer.Default和 Compar
java.util.Comparator.naturalOrder 采用 > 并返回一个 Comparator - 为什么？
(如果这是重复的，请指出正确的答案!我搜索并阅读了几个(> 5)个相关问题，但似乎没有一个是正确的。还查看了泛型常见问题解答和其他来源...) 当一个集合类接受一个比较器时，它应该具有 Compara
common-lisp - #'equal compare true compared to (list 7 1) but false when compared to ' (7 1)，为什么？
SBCL 1.3.1 综上所述，a是一个列表，'(7)，b通过setq sbcl This is SBCL 1.3.1.debian, an implementation of ANSI Common

首页

博学

6Ren·AI

商城

Python Pandas : Compare two CSV files and delete lines from both the file by matching a column