python - 使用 pandas 比较两个 Excel 文件-6ren

python - 使用 pandas 比较两个 Excel 文件

转载作者：行者123 更新时间：2023-12-01 01:41:23

30

4

我有两个 Excel 文件，A 和 B。A 是主副本，其中提供了员工姓名和组织名称(Name 和 Org)的更新记录。文件 B 包含具有较旧记录的 Name 和 Org 列以及许多我们不感兴趣的其他列。

   Name      Org
0   abc    ddc systems
1   sdc    ddc systems
2   csc    ddd systems
3   rdc    kbf org
4   rfc    kbf org

我想对此进行两个操作:

1) 我想将 Excel B(列 Name 和 Org)与 Excel A(列 Name 和 Org)并使用 Name 和相应 Org 的所有缺失条目更新文件 B。

2) 对于文件 B 中的所有现有条目(列 Name 和 Org)，我想将文件和与文件 A 进行比较并更新 Org 列(如果任何员工组织发生更改)。

对于解决方案 1)，要找到尝试以下方法的新条目(但不确定这种方法是否正确)，输出是元组，我不确定如何更新回 DataFrame。

diff = set(zip(new_df.Name, new_df.Org)) - set(zip(old_df.Name, old_df.Org))

任何帮助将不胜感激。谢谢。

最佳答案

如果名称是唯一的，只需连接 A 和 B，并删除重复项。假设 A 和 B 是您的 DataFrame，

df = pd.concat([A, B]).drop_duplicates(subset=['Name'], keep='first')

或者，

A = A.set_index('Name')
B = B.set_index('Name')

idx = B.index.difference(A.index)
df = pd.concat([A, B.loc[idx]]).reset_index()

两者在性能方面应该大致相同。

关于python - 使用 pandas 比较两个 Excel 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51852514/

30

4

0

文章推荐： python - 展平多态模型

文章推荐： python - django 表单未验证

文章推荐： Python:如何分割字符串但保留非字母数字字符

excel - Excel 中基于单元格引用引用另一个 Excel 文件的公式
我想制作一个引用另一个 excel 文件中的单元格的公式。我已经弄清楚了，如下所示: ='C:\Users\17\Desktop\[JAN-11 2011.xlsx]1'!$H$44 但由于此工作表中
excel - (Excel) 在 Excel 中报告街道号码
有谁知道是否可以在 Excel 中生成缺少地址门牌号的报告？例如，我们在 Apple St (no.5, 9, 11) 有三个地址记录，是否可以生成一个报告: 列出工作簿中每条街道的所有记录街道编号
excel - Excel 打开时隐藏功能区 - Excel 2016
这个问题已经有答案了: VBA auto hide ribbon in Excel 2013 (7 个回答) 已关闭 4 年前。我试图在打开工作文件时隐藏我的丝带。我已点击以下链接，但不断收到运行
excel - VBA excel - 从 excel 调用函数
我编写了一个 VBA 程序来删除元音。我无法从 excel 调用该函数。我收到 #NAME 错误。下面的代码 Function REMOVEVOWELS(Txt) As String 'Removes
excel - 微软 Excel : Formula in MS Excel
嗨，我正在尝试在 MS excel 中应用一个函数(正确函数) 但是当我编写这个函数并使用填充句柄将其复制到其他单元格时，我在所有复制的单元格中得到相同的输出。但是当我点击单元格时，引用是好的。但结
excel - 根据匹配的 excel 列比较两个 excel 列中的数据
假设我有一个格式如下的电子表格: Sheet 1 | Sheet 2 name email | name e
excel - 如何从使用 Excel VB 的文本框来自两个或多个用户窗体的文本框中输入数据将数据输入到 Excel？
我正在尝试简化财务报告中的数据输入，因此我尝试使用 Excel Visual Basic 制作表格。到目前为止我做了2个用户表单，以后我会做5个。我做了用户表单，以便数据输入运算符(operator
excel - 从 Excel 公式中提取参数或字符串 - Excel 2003
我需要对单元格公式而不是单元格内容执行 Mid 或 Find。如果我的单元格公式是: =[功能](Arg1, Arg2, Arg3) 我需要能够将 Arg2 提取到另一个单元格。如果不使用 VBA
excel - 另存为嵌入另一个 Excel 文件中的 Excel 文件
我想用 VBA 管理嵌入在另一个 Excel 文件中的 Excel 文件。我可以使用 .docx 文档找到很多结果，但我坚持使用 .xlsx 文档。我最后一次尝试是使用 OLE 对象，但停留在“Sa
excel - 在不使用 Excel 的情况下检查 Excel 文件是否以兼容模式保存
我最近一直在尝试使用 perl 和一些模块来读取 Excel 文件，尤其是单元格的格式。例如，我写了一段使用 ParseExcel 模块读取单元格背景颜色的 perl 代码。然而，在测试时我注意到对
excel - 具有多个表格的单个 Excel 工作表 Laravel/Excel
我目前正在使用 Maatwebsite 的 Excel 包，并且能够很好地生成一个包含我想要的列和值的表格，但我希望能够生成表格，其他表格位于单个 Excel 工作表的下方。可能吗？上面附上的屏幕截
excel - 根据另一个 excel 文件中的值删除 excel 文件中记录的最快方法
我需要以下方面的指导。我有一个包含 150000 条记录的文件 (excel)。收到另一个包含 5000-6000 条记录的 excel 文件，需要根据第二个文件中信息的某些条件删除该行。我使用字典
excel - 标准 Excel 公式的行为取决于我使用的 Excel 版本
我有我认为的标准公式，根据我使用的 Excel 版本、Excel 365 或 Excel 2019 的不同，它的行为会有所不同 =IF(F5=$M$1;IFERROR(IF(AND(IFERROR(F
excel - 打开文件时在 Excel 的新实例中打开特定的 Excel 文件
信息: 我有一个名为 Demo.xlsm 的 Excel 文件此文件包含一个名为 UserForm1 的用户表单，该用户表单会在打开文件时自动加载。打开文件时，名为 Demo.xlsm 的工作簿也
excel - 在另一个 Excel 工作表中查找一个 Excel 工作表中的值
我在A Excel工作表中有一个列，其值是1 1 1 2 2 2 3 3 3 4 4 4....，在B Excel工作表中有另一列，其值1 2 4 ....，什么我想要的是从 B 读取值并查看它们是否
excel - 使用 excel 或在 excel 中求平均值
所以，我有这个问题，我想通过使用 OR 函数检查调整列的条件来找到列的平均值，我尝试将 OR 放入 AverageIf 函数，失败，还尝试了“Average(IF( OR("再次不是正确的返回。认为这
excel - 使用其他 Excel 单元格的字符串值表示公式中的 Excel 单元格地址？
假设我想要这种类型的formula = SUM(startcell:endcell)的答案，但是startcell和endcell组件发生了变化。因此，我希望能够使用和中的任何值，而不是直接在公
excel - 根据单元格值将行从一张 Excel 工作表复制到另一张 Excel 工作表
我正在寻找一个简单的 Excel 宏，它可以根据单元格中的特定数字/值将行从一张工作表复制到 Excel 中的另一张工作表。我有两张纸。一个称为“master”，另一个表称为“top10”。这是数据
excel - 如何从一个 Excel 工作簿调用另一个 Excel 工作簿中特定于工作表的宏？
我正在尝试调用另一个工作簿中的 Excel 宏。它是一个特定于工作表的宏，但 Microsoft 文档和网上研究给出的语法仅提供了一种仅通过工作簿访问宏的方法。该语法是: Application.Ru
excel - 如何使用特定单词复制 Excel 中的行并将其粘贴到另一个 Excel 工作表？
我检查了很多不同的帖子，但似乎找不到我正在寻找的确切代码。另外，我以前从未使用过 VBA，因此我尝试从其他帖子中获取代码并输入我的信息以使其正常工作。还没有运气。在工作中，我们有一个 Excel 薪资

首页

博学

6Ren·AI

商城

python - 使用 pandas 比较两个 Excel 文件