gpt4 book ai didi

classification - 没有训练数据时如何对聊天文本进行分类?

转载 作者:行者123 更新时间:2023-12-04 04:57:59 30 4
gpt4 key购买 nike

我有一个用例,其中要对聊天文本进行分类。我想在 Apache OpenNLP 中使用 DocumentCategorizer 对聊天进行分类。但为此,我必须拥有已经对聊天进行分类的训练数据。我是否必须手动对数百个聊天进行分类以准备训练和测试数据?我还能做什么?我打算聊天类别是与服务相关的问题。这个类别列表将是特定于域的。此数据的提供者是否应向我提供分类聊天数据?
谢谢,提前。

最佳答案

根据定义,没有标记数据就不会出现分类问题。要么有人标记(至少部分)数据,要么您应该尝试以不同的方式解决问题。

——
编辑添加了一些如何在不分类的情况下解决问题的示例:

通常,根据特定任务,您可以尝试通过聚类或/和文档或术语匹配来解决“分类”问题。聚类将与同一主题相关的文档分组在一起,而术语匹配将观察引用特定术语的文档。如果没有可用的训练数据,但您对问题有一些了解,那么任一方法或它们之间的组合可能足以满足您的信息需求。

对于您的具体问题,我将开始尝试对聊天进行聚类。

关于classification - 没有训练数据时如何对聊天文本进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16518998/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com