gpt4 book ai didi

Python Pandas Dataframe 在单元格中搜索文本

转载 作者:行者123 更新时间:2023-12-01 00:27:53 25 4
gpt4 key购买 nike

这是我在 stackoverflow 上的第一篇文章:) 我已经开始学习 python 和 pandas 库。我在单元格数据框中查找文本时遇到问题。

程序:

导入两个文件csv(这里没有问题):

1数据帧:

Column1  | Column2
546852 | Lorem ipsum dolor sit amet
248597 | Amet luctus venenatis lectus magna fringilla.
842457 |  Neque egestas congue quisque egestas.
8465 | Amet luctus venenatis lectus
648 |  Neque egestas congue
55 | Lorem ipsum dolor

2数据帧:

DATA 
Lorem
Lectus
Congue
etc.

我的问题:如何在 1Dataframe.columna2 中从 2dataframe(Lorem、Lectus、Congue 等)中查找单词并生成 3 列的数据框:

Column1  | Column2                                                | Column3 
546852 | **Lorem** ipsum dolor sit amet | Lorem
248597 | Amet **luctus** venenatis lectus magna fringilla. | Lectus
842457 |  Neque egestas **congue** quisque egestas. | Congue
8465 | Amet **luctus** venenatis lectus | Lectus
648 |  Neque egestascongue **congue** | Congue
55 | **Lorem** ipsum dolor | Lorem

我在 Google 上搜索过,但没有找到任何解决方案。我终于敢在 stackoverflow 上写文章了:)

最佳答案

这是一种方式:


def find_elements(row):
for element in df2.Data.unique():
if row.Column2.str.contains(element):
return element

df3 = df1.copy()
df3["Column3"] = df3.apply(find_elements, axis=1)

这应该可行,当然,您可以找到其他方法来做到这一点。

编辑:正如@vb_rises提到的,如果多个单词在同一个句子中,该函数将仅返回第一个匹配项。

关于Python Pandas Dataframe 在单元格中搜索文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58414115/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com