gpt4 book ai didi

machine-learning - 有使用强化学习进行文本分类的例子吗?

转载 作者:行者123 更新时间:2023-11-30 08:24:42 30 4
gpt4 key购买 nike

想象一个二元分类问题,例如情感分析。既然我们有了标签,我们不能使用实际与预测之间的差距作为 RL 的奖励吗?

我想尝试强化学习来解决分类问题

最佳答案

有趣的想法!据我所知是可以做到的。

  1. 模仿学习 - 在较高层面上,它正在观察环境中代理执行的样本轨迹,并使用它来预测给定特定统计配置的策略。我更喜欢使用概率图形模型进行预测,因为模型具有更多的可解释性。我已经从研究论文中实现了类似的算法:http://homes.soic.indiana.edu/natarasr/Papers/ijcai11_imitation_learning.pdf

  2. 逆强化学习 - 斯坦福大学的 Andrew Ng 开发了一种类似的方法,用于从样本轨迹中找到奖励函数,并且奖励函数可用于构建所需的 Action 。 http://ai.stanford.edu/~ang/papers/icml00-irl.pdf

关于machine-learning - 有使用强化学习进行文本分类的例子吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44653180/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com