gpt4 book ai didi

python - 合并 2 个 csv 文件 - html 编码

转载 作者:太空宇宙 更新时间:2023-11-03 17:36:21 25 4
gpt4 key购买 nike

我需要按名为“名称”的一列合并 2 个 csv 文件。列“名称”具有混合类型。

数据是 html 编码的。文件“a”比文件“b”包含更多行。

我想要的输出应该只包含文件“b”中的名称。

文件:id_public、名称、计数

文件 b: ID、名称

数据如下所示:

姓名: Å elomo Ben-Meleḵ; A.C.P.M.; Álvarez de Paz,马里奥1860-1920;啊,彼得;等等

我已经能够合并这些文件,但只会丢失所有包含特殊字符的行(例如,我的合并文件将仅包含 Aahl、Peter)。我的代码如下所示:

import pandas as pd

a = pd.read_csv("a.csv", low_memory=False)
b = pd.read_csv("b.csv", low_memory=False)

merged = a.merge(b, on='name')

非常感谢您的帮助。

最佳答案

您的问题与编码无关,您只是使用了错误的合并类型。您想要执行正确合并:

merged = a.merge(b, on='name', how='right')

请参阅docs

关于python - 合并 2 个 csv 文件 - html 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31161195/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com