- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
是否有任何 C# 算法可以从文本中提取人名和地名?
例如,给定以下文本:
St. Mark died at Alexandria, in Egypt. He was martyred, I think.
However, that has nothing to do with my legend. About the founding of
the city of Venice--
(摘自马克吐温的《国外的无辜者》)
...有没有办法提取:
St. Mark
Alexandria (or better yet, "Alexandria, Egypt")
Venice
?
我意识到没有办法获得 100% 的准确率(捕获所有地名和人名,并且不添加“误报”),但 80% 的准确率可能非常有值(value)。
我知道每个词都可以与百科全书或类似的东西进行比较,但必须有更好的方法。此外,该算法怎么知道将“St.”组合起来。和“Mark”,并将“Alexandria, in Egypt”视为“Alexandria, Egypt”?
最佳答案
我注意到此处提供的链接有些过时。斯坦福自然语言处理 (NLP) 库 (https://nlp.stanford.edu/software/) 是一个仍然活跃的项目(并且是免费的 [更正:GPL,因此非商业免费])。您可以演示他们的命名实体识别 (NER) here .它甚至有一个 .NET 包装器 ( http://sergey-tihon.github.io/Stanford.NLP.NET/StanfordNER.html )。
Microsoft 还通过 Azure 认知服务提供了许多类似的算法。您会对实体链接 ( https://azure.microsoft.com/en-us/services/cognitive-services/entity-linking-intelligence-service/ ) 最感兴趣
希望对 future 的观众有所帮助。
关于c# - 如何使用 C# 从文本中提取人名和地名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29880935/
我想找到用户在 map 上选择的位置名称。目前我正在获取纬度和经度。但无法获取位置名称。 我正在使用 angularJS 和 angular-google-maps 2.1.5。 这是 html。
例如: 算法目前可以过滤这句话 What is the weather in San Francisco? 对此 什么:代词 是:动词 的:确定者 天气:名词 在:介词 旧金山:地名 我编写的代码
我是一名优秀的程序员,十分优秀!