gpt4 book ai didi

azure - 使用 LUIS Azure 语言服务分析整个文档文本

转载 作者:行者123 更新时间:2023-12-03 02:33:14 24 4
gpt4 key购买 nike

我训练了一个 Azure LUIS 服务模型,该模型将句子作为输入,提取关键信息,然后返回 JSON 响应。

它对于短句子运行良好,现在我希望它能够获取文档(PDF、DOCX)并分析所有页面,然后提取所需的信息(如起始日期、结束日期、公司名称等)。是否可以通过任何添加来做到这一点?

或者有关如何分析整个文档并提取关键信息的任何指导。

任何类型的信息将不胜感激!谢谢

最佳答案

如果您传递句子或话语,@Farhan Mubasher LUIS 可以很好地提取日期和名称等信息作为实体。其中大多数实际上可以作为预构建的实体来训练模型并从话语中提取它们。

如果您打算像使用多页 PDF 文档一样使用整个文档,那么使用 form recognizer 等服务会更容易。或使用READ API Azure 计算机视觉来提取文本。使用一些预处理技术,您可以将句子传递给经过 LUIS 训练的模型并处理响应。

如果您的最终目标是从某种格式的文档中提取日期和公司信息等信息,那么表单识别器效果很好。你只需要用一些类似格式的文档来训练模型,然后使用Analyze API将此信息提取为 JSON 响应中可用的标签。请查看表单识别器labeling tool设置和使用非常简单。

关于azure - 使用 LUIS Azure 语言服务分析整个文档文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64175285/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com