gpt4 book ai didi

parsing - 如何利用机器学习提取公司债券信息

转载 作者:行者123 更新时间:2023-11-30 09:01:56 24 4
gpt4 key购买 nike

我正在开展一个项目,需要从非结构化电子邮件中提取公司债券信息。经过大量研究后,我发现机器学习可以用于信息提取。我尝试了 Opennlp NER(命名实体识别器),但我不确定我是否为这个问题选择了正确的库,因为我得到了结果,但没有达到标准。

有人可以建议我任何库或算法吗?这意味着我如何解析并从中提取数据。我计划探索朴素贝叶斯、N-gram 或支持向量机,但不确定这是否对我有帮助。请提出建议。

示例如下:

[/]交易10mm ABC 2.5 19 05/06 mkt可以使用50mm --->这里我要提取“ABC 2.5 19”

示例2:

XYZ 6.5 15 10-2B 106-107 B3 AAA- 1.646MM 2x2 ---> 这里我想提取“XYZ 6.5 15”

最佳答案

在 Perl 中,您可以使用 Marpa::R2 — 通用 BNF 解析器。

这个gist从您的示例中提取信息。

希望这有帮助。

关于parsing - 如何利用机器学习提取公司债券信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25758919/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com