gpt4 book ai didi

python - 使用 python 在新闻中搜索公司名称

转载 作者:行者123 更新时间:2023-12-01 03:36:22 25 4
gpt4 key购买 nike

我有如下公司列表

companies = [Advance Auto Parts Inc, AllianceBernstein Holding L.P., AbbVie Inc., Asbury Automotive Group Inc, ABM Industries Incorporated]

我还有每日新闻数据。

News = ['news1', 'news2', 'news3']

现在我想在新闻数据中搜索这些名称,但在新闻中公司名称不会像上面的列表中那样以完整名称出现。我想做这样的事情:

for news in News:
for company in companies:
if (company in news):
print('do something')

我现在想到的最好的想法是以新闻中预期的方式命名所有公司的名称,但这将花费很多时间,因为我有数千家公司。有什么建议来处理这个问题吗?谢谢。

最佳答案

首先尝试识别最常见的结尾;例如IncLtd,那么您就可以搜索 Advance 的新闻Auto Parts Inc 和精简版 Advance Auto Parts。然后你可以尝试找出是否有任何其他单词,如Group或字符串如And Sons姓名。

每次运行新闻搜索功能时,先使用全名,然后使用每个精简版本。

news(company_name):
stripped_versions = company_name
stripped_versions += strip(company_name)
for version in stripped_versions:
search_news(version)

其中 stripped_versions 是包含剥离版本的公司名称列表,例如:[Advance Auto Parts Inc, Advance Auto Parts]

我希望这个伪代码可以帮助您解决问题

关于python - 使用 python 在新闻中搜索公司名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40323639/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com