gpt4 book ai didi

c# - 如何使用 C# 从文本中提取人名和地名?

转载 作者:行者123 更新时间:2023-12-02 00:59:52 24 4
gpt4 key购买 nike

是否有任何 C# 算法可以从文本中提取人名和地名?

例如,给定以下文本:

St. Mark died at Alexandria, in Egypt.  He was martyred, I think.
However, that has nothing to do with my legend. About the founding of
the city of Venice--

(摘自马克吐温的《国外的无辜者》)

...有没有办法提取:

St. Mark
Alexandria (or better yet, "Alexandria, Egypt")
Venice

?

我意识到没有办法获得 100% 的准确率(捕获所有地名和人名,并且不添加“误报”),但 80% 的准确率可能非常有值(value)。

我知道每个词都可以与百科全书或类似的东西进行比较,但必须有更好的方法。此外,该算法怎么知道将“St.”组合起来。和“Mark”,并将“Alexandria, in Egypt”视为“Alexandria, Egypt”?

最佳答案

我注意到此处提供的链接有些过时。斯坦福自然语言处理 (NLP) 库 (https://nlp.stanford.edu/software/) 是一个仍然活跃的项目(并且是免费的 [更正:GPL,因此非商业免费])。您可以演示他们的命名实体识别 (NER) here .它甚至有一个 .NET 包装器 ( http://sergey-tihon.github.io/Stanford.NLP.NET/StanfordNER.html )。

Microsoft 还通过 Azure 认知服务提供了许多类似的算法。您会对实体链接 ( https://azure.microsoft.com/en-us/services/cognitive-services/entity-linking-intelligence-service/ ) 最感兴趣

希望对 future 的观众有所帮助。

关于c# - 如何使用 C# 从文本中提取人名和地名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29880935/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com