gpt4 book ai didi

javascript - 从非结构化字符串中提取键值对的最佳方法?

转载 作者:搜寻专家 更新时间:2023-10-31 23:50:20 25 4
gpt4 key购买 nike

最多避免特定模式的硬编码规则。

我目前正在从事与 AWS Textract 类似的项目,link here .我已经成功地从文件中提取数据,但是以一种非结构化的方式。现在,我正试图以最佳方式找出如何从那堆信息中获取现有的键值对。

例如我们有这样的文本:

In this document we will find different key and values like this id : 1 and that country : France with no specific punctuation and probably talking about how good is my health...

提取会是这样的:

id : 1
country : France
health : good

我真正知道的是,亚马逊使用“置信度”变量从那种场景中提取信息,我猜这涉及到一些机器学习算法。就我而言,我没有那么大的数据库可供学习。

我很确定有一个更简单的解决方案,既不不够灵活。

最佳答案

我相信spaCy图书馆可能是满足您需求的正确工具。查看 GitHub 上的描述以弄清楚。

它可以使用 spacy-nlp 暴露给 Node JS包。

关于javascript - 从非结构化字符串中提取键值对的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53691435/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com