gpt4 book ai didi

python - 财经新闻的机器学习

转载 作者:行者123 更新时间:2023-11-30 09:38:01 26 4
gpt4 key购买 nike

我有一个来自各种金融网站(例如 Bloomberg、MarketWatch、CNN 等)的新闻文章列表。我想根据它们的财务相关性对这些文章进行分类,以便了解是否涉及任何财务困境或任何危机。

我使用 NLTK 在 Python 中开发了一个程序,该程序根据每篇文章的财务相关性给出评分。

目前,我正在使用关键字列表/词典,例如:

  • 市场
  • 财务
  • 损失
  • 贷款等

并检查新闻文章中存在此列表中的单词数量,并为每个单词保留分数,然后将所有单词分数相加以获得总体分数。

同样,我有金融短语列表/词典:

  • 未能与债权人达成一致
  • 申请破产
  • 第 11 章等的文件

将此列表和上面列表中的分数相加,然后将总分分配给文章,作为其相关性的指标。

我想将机器学习纳入此过程,并希望将上述方法中已经分类的新闻文章作为训练集。

请帮助找到实现此目的的最佳算法。

最佳答案

这是一个分类机器学习问题,逻辑回归可以解决这个问题:

Logistic Regression Wikipedia

关于python - 财经新闻的机器学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25523628/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com