Azure 开放 AI 模型产生意外响应-6ren

Azure 开放 AI 模型产生意外响应

转载作者：行者123 更新时间：2023-12-03 03:23:48

26

4

我使用 Curie 作为基本模型，使用自定义数据集创建了一个微调模型。我正在使用 Azure OpenAI 服务。

该模型正在尝试使用最大可能的 token 生成响应。例如，如果 max_token 参数设置为 200，则模型响应始终具有 200 个标记，这会导致响应变得重复并以收入完整的句子结束。

示例 1(当我问不基于训练数据的一般问题时)输入:一+一等于？

响应“0”存在惩罚

一加一等于二。这是问题“一+一等于什么？”的正确答案。一加一等于二。这是问题“一+一等于什么”的正确答案等于？“一加一等于二。这是正确答案

响应“1”存在惩罚

一加一等于二。数学就是加法和减法。例如，如果您有两支铅笔，则可以用一支铅笔擦去另一支铅笔。或者，如果您有两本书，您可以用一本来标记另一本书。另外，二等于四。二是数字系统中的第二个数字。二也是数字对中的第一个数字。例如，二是“2 和 4”对中的第一个数字。二

问题该模型尝试使用“max_token”参数中定义的所有标记，因为响应中会重复单词和短语。

示例 2(当我根据训练数据提出问题时)输入:什么是数学中心

回应

？数学中心是一个综合性在线资源，旨在帮助中学生掌握数学。数学中心可以 24 小时访问教学视频、练习册、练习工具和自适应评估，是提高数学成绩和成绩的最有效方法。有超过 2000 万学生、家庭和教育 worker 使用 Math Center，这是取得数学成功的最佳方式。数学中心是数学学习平台的一个部门，该平台是数学中心基金会和国家数学咨询小组之间的合作项目。要了解有关 Math Center 的更多信息，请访问网站 mathcenter.org。什么是 Math Center Premium？Math Center Premium 是一个综合在线资源，旨在帮助中学生掌握数学。 Math Center Premium 可以 24 小时访问教学视频、练习册、练习工具和自适应评估，是提高数学成绩和成绩的最有效方法。有超过 2000 万学生、家庭和教育 worker 使用 Math Center Premium，这是最好的方式

问题

我的问题没有以问号结尾，因此模型响应以问号开头，因为它存在于训练数据中
部分回复内容并非基于训练数据，而且完全断章取义
模型本身添加了一些问题并在回复中回答了这些问题
模型正在尝试利用 100% 的可用 token

最佳答案

您面临的问题似乎与 Azure OpenAI 服务中的最大 token 长度参数有关。当您将最大 token 长度设置为较高值时，模型会尝试使用所有可用的 token ，这可能会导致重复且不完整的响应。

要解决此问题，您可以尝试将最大 token 长度参数减小到较低的值。这将迫使模型生成更简洁和相关的响应。您可以尝试不同的最大 token 长度参数值，以找到适合您的用例的最佳值。

关于模型生成脱离上下文或不基于训练数据的响应的问题，如果模型未在多样化且具有代表性的数据集上进行训练，则可能会发生这种情况。为了提高响应的质量，您可以尝试在涵盖广泛主题和场景的更大、更多样化的数据集上训练模型。

此外，您可以尝试使用存在惩罚参数来阻止模型在响应中重复相同的短语或句子。存在惩罚参数对生成响应中已存在的标记的模型进行惩罚。通过设置更高的存在惩罚值，您可以鼓励模型生成更加多样化和独特的响应。

最后，为了解决模型生成问题并在响应中回答问题的问题，您可以尝试使用问答模型而不是语言生成模型。问答模型专门设计用于根据给定上下文回答问题，并且可以生成更准确和相关的响应。

关于Azure 开放 AI 模型产生意外响应，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/76153691/

26

4

0

文章推荐： Azure Synapse Pipeline如何将每个文件作为sql脚本执行？

文章推荐：从 Azure CLI 应用 ansible playbook 时出现 Azure MSI token 问题

wit.ai - 将数据导入wit.ai
更新:下面提到的stackoverflow给出了另一种解决方案，即导入json并用正确格式的数据替换文本。我现在试图看看如何适应给定的格式，它看起来像这样: { "text" : "use
artificial-intelligence - luis.ai 与 api.ai 与 wit.ai 之间的比较？
有谁知道三者之间的具体区别和功能，或者作为开发人员是否有更多功能/更灵活地使用？最佳答案 wit.ai 与 Dialogflow 与 luis.ai ╔═══════════════════════
wit.ai - 有没有办法自动训练 Wit.ai？
我知道 Wit.ai 引擎可以通过手动验证案例来训练，但是有没有办法用一组定义的输入和输出来训练它？最佳答案您可能可以查看其中一个应用程序的导出格式并对其进行调整以导入新应用程序。 https:/
wit.ai - wit.ai 的商业用途
来自 wit.ai 团队的一些人请回答这个我们计划将 wit.ai 用于商业目的。有使用政策吗？请提供一些注意事项指南。此外，这项服务将来是否也是免费的，还是您计划推出企业版？主要是 API 命中
api-ai - 在对话框流中添加确认实体(api.ai)
我需要添加一个确认实体，以便在对话框流 (api.ai) 中的某个操作的参数中得到"is"或“取消”。假设用户正在购买咖啡，我会询问有关咖啡和数量的详细信息，最后我需要确认，我应该向哪个实体申请？任何
python - 考虑一个整数数组 n A=[a1,a2,a3......an]。查找并打印满足 ai*aj <= max(ai,ai+1,.....aj) 的总对数，其中 i < j
谁能帮我解决上面的问题。我们必须在数组 (a1,a2),(a1,a3),(a1,a4).... 等中找到元素的组合，然后选择满足条件 (ai*aj) <= max 的组合(A) 其中 A 是数组并返回
wit.ai - 我是否正确地训练了我的 wit.ai 机器人？
我正在尝试训练我的 Wit.ai 机器人以识别某人的名字。我不太确定我是否完全理解 NLP 的工作原理，所以我会给你一个例子。我定义了很多表达，比如“我的名字是XXXX”、“大家都叫我XXXX” 在
algorithm - 是否存在用于测试棋盘游戏 AI 与其他 AI 的通用站点？
我想知道是否存在一个网站，人们可以上传他们的 AI 在不同的棋盘游戏中相互竞争:国际象棋、五子棋等。该站点将接受程序的源代码(以某种通用语言编写)、对其进行编译并相互运行程序。所有程序都必须使用一些
Golang AI 开发：通过将 AI 集成到你的应用程序
大家好，我是程序员幽鬼。你想为后代开发一个令人难以置信的应用程序，你想到的第一件事——人工智能!还有什么比模仿人类智能的机器更令人着迷的呢?如果你期待打破刻板印象并准备推出出色的 AI 应用
azure - 将 AI Analytics 查询添加到 AI 仪表板？
我在 Application Insights Analytics 中创建了几个查询来获取我想要的图表。示例: customEvents | where timestamp >= ago(31d)
wit.ai - 使用 wit.ai API 删除实体值
我似乎无法让这个请求生效: https://wit.ai/docs/http/20160526#delete--entities-:entity-id-values-link 我已经设置了一个值为“C
wit.ai - wit.ai 的 Node.js 客户端调用多个自定义操作
我正在尝试在 wit.ai 中编写示例应用程序。我使用在 https://wit.ai/docs/quickstart 中显示的 node.js 客户端跟随快速启动应用程序。 .那里显示的示例只有一个
php - 如何在dialoglow(api.ai)中生成我的代理的api.ai url并在PHP中使用该api URL将用户的输入存储在MYSQL数据库中
在 api.i(dialogflow) 中，我想获取用户的输入，如姓名、年龄、邮件等，并使用 PHP 将它们存储在我的 MYSQL 数据库中。如何在对话流中生成我的代理的公共(public) API
wit.ai - 使用跨域 HTTP API 检索 Wit.ai 机器人文本响应
我目前正在与 Wit.ai 合作 webpage in CodePen.io .我想知道是否可以使用 HTTP API 检索 Wit.ai 机器人的文本响应(“Bot says”)。例如:如果用户要
java - 使用 Minimax 算法的 NIM 游戏和 AI 玩家 - AI 会输棋
我接到了一项任务，要编写一个由人类玩家和 AI 玩家组成的 NIM 游戏。游戏是“Misere”(最后一个必须拿起一根棍子的人输了)。 AI 应该使用 Minimax 算法，但它正在采取使其输得更快的
google-ai-platform - 如何取消部署模型，或者特别是如何从 Vertex AI 上的 shell 获取已部署模型的 ID？
为了通过 shell 从端点取消部署模型，我必须指定 deployed-model-id如 gcloud ai endpoints undeploy-model 中所述我如何获得这个已部署的模型 I
docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)
我在谷歌的 Vertex AI 中运行自定义训练作业。执行自定义作业的简单 gcloud 命令将使用类似于以下语法的内容(可以查看命令的完整文档 here ): gcloud beta ai cust
wit.ai - 有没有办法通过 HTTP API 管理(创建/编辑/验证)Wit AI Stories？
Wit AI project 在他们的 Converse 功能中添加了一个名为 Story 的新概念。有没有办法通过 HTTP API 管理(创建/编辑/验证)这些 Wit AI 故事？最佳答案 W
dialogflow-es - 我可以在不使用 Google 的 AI 平台 (Api.ai) 的情况下将应用程序部署到 Google Assistant
我想为 Google 智能助理部署一个应用。但是，我想使用不同的 AI 后端而不是 api.ai。有人知道这是否可能吗？如何？或者如果我想使用 Google 智能助理，我会被 api.ai 困住吗
gcp-ai-platform-notebook - 如何在 GCP AI Platform Notebook 上运行 Python 3.6
我的项目有一个依赖项，需要 python v3.6+。因此，它会在通过 pip 在 python 3 内核中安装时抛出错误，因为 AI Platform Notebooks 默认附带 v3.5。如何使

首页

博学

6Ren·AI

商城

Azure 开放 AI 模型产生意外响应