gpt4 book ai didi

networking - 用于聊天机器人训练的深度学习

转载 作者:行者123 更新时间:2023-12-05 07:45:05 26 4
gpt4 key购买 nike

我们正在尝试为客户服务创建一个智能聊天机器人。我们有一个客户服务问题和答案语料库,每个对话都有一个标记的意图。我们正在探索使用深度学习来训练我们的模型,但我们遇到了几个问题:

1 - 如何进行特征工程以在文本数据上训练模型。具体来说,如何将语言转化为向量?
2 - 如何使用您用作意图识别深度学习分类器输入的非单词特征?你如何适应客户产品名称?3 - 如何为带有文本输入的深度学习选择神经网络架构?4 - 我们如何处理没有足够数据的情况?使用贝叶斯技术?

最佳答案

很酷..很棒的开始!!

在你开始实现之前,我建议你先学习一些基础知识。

无论如何,这里是您问题的答案。 !!

特征工程:顾名思义,在您的数据中,有些东西可能会降低模型的准确性。比如混合了小写和大写字符的单词、数字、特殊字符、以某些特殊字符结尾的行……等等,经过特征工程后可以提供更高的准确性!!但这同样需要取决于您拥有的数据类型!!

将语言转化为向量:任何类型的语言,最后是文本(这里是你的例子)。我们可以为单词或字符提供向量表示。这种向量表示可以通过一个热向量或使用预构建的方法(如 word2vec 或 glove)获得。

一个热门向量:- 假设您的训练数据集中有 100 个单词。然后为每个单词创建 k 维向量。其中 k 是单词总数。按字符位置排序单词。并基于三个排序顺序创建向量,保持索引位置为 1,其余为 0。

ex: [1 0 0 0 0 ....] - word1
[0 1 0 0 0 ....] - word2
[0 0 0 0 0 ...1] - word100

非词特征:遵循与词特征相同的规则客户产品名称:- 创建一个热门矢量,因为它们通常不在文本中使用。它们在现实生活中没有任何意义。

如何选择 NN :- 这取决于您想要实现的目标。 NN 可以以多种方式用于多种目的。

数据不足:- 这又取决于您的数据。 !!如果您的数据具有更常见的模式,并且在未来的数据中这些模式也会出现!!那么用NN还是可以的。否则我不建议使用 NN。

祝你好运!!

关于networking - 用于聊天机器人训练的深度学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42225539/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com