gpt4 book ai didi

machine-learning - 用于从给定文本中提取多个值的自学习解决方案

转载 作者:行者123 更新时间:2023-11-30 09:35:08 25 4
gpt4 key购买 nike

假设,Message1 = 您的帐单金额 121.0 将于 2 月 15 日到期,同样 Message2 = 帐单金额 234.0 于 6 月 11 日到期,依此类推。我想从类似消息中提取账单金额和到期日期。一种方法是为每种可能的格式编写正则表达式。但这将无法处理新格式。

解决这个问题的机器学习方法是什么?如何训练模型并使用它从新消息中提取金额、到期日期?

最佳答案

为了更好地回答您的问题,我需要知道如何提供训练数据?您会为每个训练示例获得标签吗?您想使用任何涉及深度神经网络的先进技术吗?

例如,如果你想使用序列标记,那么你可以引用Supervised Sequence Labelling with Recurrent Neural Networks by Alex Graves第 2 章了解更多详细信息。对于您的任务,我认为您可以先尝试更简单的方法。

例如,模式挖掘或基于模板的方法应该在这方面为您提供帮助。此外,解析技术(例如依赖项解析)可以在这方面为您提供帮助。请参阅difference between dependency parsing and constituent parsing .

最后,您还可以在此场景中考虑众所周知的信息提取技术。请参阅usage of NLTK为此。

关于machine-learning - 用于从给定文本中提取多个值的自学习解决方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45067698/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com