- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在使用 OpenNLP 模型进行名称实体识别,但问题是它只能识别基于美国和英国的名称(外国名称),因此我需要识别印度名称。
这怎么可能?
最佳答案
NER 解决方案往往是特定领域的,使用硬编码单词列表作为信号(特征)和/或命名实体的内部字母结构。
英国/美国名字彼此相似,也与其他欧洲名字相似,因为许多流行的美国名字和姓氏都来自非英语的欧洲移民。印度人的名字明显不同,常用的姓名/姓氏列表和训练数据语料库通常不包含太多或任何特定于印度人的数据。
要解决您的问题,您需要根据适合您特定领域的数据训练专门的 NER 模型。
关于java - 如何在 OpenNLP 中通过 NER 识别印度名字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36027672/
我知道西欧 Windows 的默认编码是 ISO-8859-1,网络标准的默认编码是 UTF8,但我希望(谷歌让我失望)有人知道 Windows/Visual Studio/C# 的默认编码印度的软件
我正在尝试使用 twitter4j 的流媒体方法从印度地区捕获推文。我正在使用低于纬度和经度的值,但我得到的结果低于异常值。 纬度/经度无效:8.07、68.12、37.10、97.42 这是我的代码
导入请求 x = requests.get(' https://www1.nseindia.com/live_market/dynaContent/live_watch/equities_stock_
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 8年前关闭。 Improve this que
我正在评估 iText 作为 Java swing 应用程序的 PDFGenerator。输出应该是“马拉地语”,这是一种与印地语类似但不相同的印度本地语言。 出于评估目的,这是我尝试打印的文本: म
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
是否有任何工具/网站可以让我以多种印度语言(卡纳达语、马拉地语、泰米尔语、印地语等)中的一种输入一些文本并将其翻译成英语。 谷歌翻译目前只支持印度语言中的印地语。 最佳答案 我意识到这是一个很老的问题
我无法找到在 android-google-billing-pop-up 中显示介绍价格的方法, 我的问题: as you can see that introductory price are no
我是一名优秀的程序员,十分优秀!