gpt4 book ai didi

stanford-nlp - 命名实体提取 - 用于货币

转载 作者:行者123 更新时间:2023-12-04 04:41:31 27 4
gpt4 key购买 nike

我有一个非常简单的问题 - 在文本中识别金钱/货币。
示例测试用例:“零用钱不应超过每年 4000 印度卢比(100 美元)。”
在默认的斯坦福解析器上失败 - 在线 -(使用 7 类模型,包括货币)http://nlp.stanford.edu:8080/ner/process - 仅适用于“$ 100”之类的文本。

在 Alchemy 演示站点上 - https://alchemy-language-demo.mybluemix.net/ , “$ 100”被识别为实体,而“USD 100”被识别为概念 - 美元

最佳答案

不确定这在所有时间之后仍然有用,但这里是:

我认为你有两个选择:

1) 用“$”替换“USD”——这将是一个简单的查找和替换,可以在您可能使用的任何工具中完成。

2) 使用不同的工具或程序。

斯坦福 NLP 很棒,但也有其他工具可用。

根据您使用的系统/语言,有许多软件包已经为您完成了这项工作。

对于 Python,我推荐 SpaCy :


# pip install spacy
# python -m spacy download en_core_web_sm

import spacy

# Load English tokenizer, tagger, parser, NER and word vectors

nlp = spacy.load("en_core_web_sm")

text = "Pocket money should NOT exceed INR 4000 (USD 100) per annum."

doc = nlp(text)

print("Money in USD:", [ent.lemma_ for ent in doc if ent.ent_type_ == "MONEY"])
# Money in USD: ['100']

这只是一个简单的例子,你可以找到更详细的脚本 here .

关于stanford-nlp - 命名实体提取 - 用于货币,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41455993/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com