gpt4 book ai didi

python - 包含 Pandas 中的函数

转载 作者:太空宇宙 更新时间:2023-11-03 16:03:13 25 4
gpt4 key购买 nike

我正在两个数据框的公司名称之间执行匹配(一种模糊匹配)。为此,我首先在所有公司名称之间执行完全合并,其中起始字母匹配。这意味着所有以“A”开头的公司将与其他数据框中以“A”开头的所有公司相匹配。这是按如下方式完成的:

df1['df1_Start'] = df1['company1'].astype(str).str.slice(0,2) 
df2['df2_Start'] = df2['company2'].astype(str).str.slice(0,2)
Merge = pd.merge(df1,df2, left_on='df1_Start',right_on='df2_Start')

现在我想要获得 FullMerge 中的所有行,其中 df1 中的公司包含 df2 中的公司。这是因为 df1 中的公司名称较长。

Merge1=Merge[Merge['company1'].str.contains(Merge['company2'].str)]

这对我不起作用。我该如何执行这个任务?另外,请建议我可以使用哪些其他方式来匹配公司名称。因为两个数据框中的公司可能是相同的,但写入方式并不完全相同。

最佳答案

我认为您需要 |join 来生成由 | (或在 regex 中)分隔的 str.contains 的所有值。 :

Merge1=Merge[FullMerge['company1'].str.contains("|".join(Merge['company2'].tolist())]

关于python - 包含 Pandas 中的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40115346/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com