gpt4 book ai didi

location - 使用 NLP 框架识别部分/完整地址

转载 作者:行者123 更新时间:2023-12-02 17:15:11 26 4
gpt4 key购买 nike

我想知道 NLP 框架需要多少工作量才能使用 NLP 框架从非结构化文本中提取部分(不含城市)或完整的邮政地址? NLP 框架能够有效地做到这一点吗?另外,“训练”命名实体识别模块来匹配新位置有多困难?

最佳答案

只要大多数地址格式正确且规则,即包含联系人姓名、街道号码、街道名称,并用逗号分隔,您就可以找到基于规则的框架。

使用非结构化或部分结构化文本将需要更多预处理和统计,例如形态句法和 CRF。 Stanford tools是为此目的最受欢迎的。搜索包含中间注释的语料库也可能是一个有趣的方向:不仅是“LOC”,还包括“NUMBER”、“STREETNAME”、“CITY”等,以便能够提取位置,即使它们不是完全的。对于这种注释,你可以看看tree-structured approaches .

因此,工作量主要取决于您要查找的正则表达式的数量。

关于location - 使用 NLP 框架识别部分/完整地址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26955305/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com