gpt4 book ai didi

chatbot - 从一个完整的句子自动生成意图和实体

转载 作者:行者123 更新时间:2023-12-02 07:19:26 27 4
gpt4 key购买 nike

我正在用 Rasa.ai 构建一个机器人.当使用 Rasa NLU 训练机器人时,我们使用训练数据文件,其中指定了文本、意图、实体等。例如,对于一个简单的餐厅聊天机器人,训练文件 data.json 可能包含

{
"text": "central indian restaurant",
"intent": "restaurant_search",
"entities": [
{
"start": 0,
"end": 7,
"value": "central",
"entity": "location"
},
{
"start": 8,
"end": 14,
"value": "indian",
"entity": "cuisine"
}
]
}

我们用它来训练模型。但是我们需要手动(或通过 GUI)创建这个训练文件。

有什么工具可以输入句子并自动创建意图和实体吗?

Sample Input: Is there any central Indian restaurant?
Sample Output: The above data.json

编辑:

为了更好地解释这个问题 - 假设我有大量的客户服务通话记录。我的理解是对 Rasa(或其他类似框架)的理解——一个人需要浏览通话记录并了解所有可能的意图、过去发生的实体组合并创建一个类似 data.json 的文件在训练模型之前如上。这似乎是一个真正无法扩展的问题。有没有一种方法可以在不涉及人员的情况下从那些 GB 大小的调用日志中生成 data.json 文件?我在这里遗漏了什么吗?

最佳答案

这正是您训练 Rasa NLU 执行的任务。接受句子并将它们转化为结构化输出。通过提供示例,您正在教导模型这是如何工作的。

因此,您不必为数以千兆字节的客户日志提供注释,而只需提供一些注释,算法就应该泛化到它尚未见过的其他句子。它的效果如何取决于您有多少意图、它们的复杂程度以及其他因素。

我将从注释几百个句子开始(markdown format 实际上更容易一些),将 50 个左右的示例分开,然后看看 Rasa NLU 对它们的预测效果如何。继续注释越来越多的示例并将它们添加到您的训练数据中,直到您对保留示例的性能感到满意为止。

关于chatbot - 从一个完整的句子自动生成意图和实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50321455/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com