python - 如何给 OpenAI 的 Whisper ASR 一些提示短语？-6ren

python - 如何给 OpenAI 的 Whisper ASR 一些提示短语？

转载作者：行者123 更新时间：2023-12-02 05:46:51

25

4

我使用 OpenAI 的 Whisper用于语音识别的 python 库。我怎样才能给出一些提示短语，因为它可以用其他一些 ASR 来完成，例如 Google ？

用 OpenAI 的 Whisper 转录(在带有 Nvidia GeForce RTX 3090 的 Ubuntu 20.04 x64 LTS 上测试):

conda create -y --name whisperpy39 python==3.9
conda activate whisperpy39
pip install git+https://github.com/openai/whisper.git 
sudo apt update && sudo apt install ffmpeg
whisper recording.wav
whisper recording.wav --model large

如果使用 Nvidia GeForce RTX 3090，请在 conda activate whisperpy39 之后添加以下内容:

pip install -f https://download.pytorch.org/whl/torch_stable.html
conda install pytorch==1.10.1 torchvision torchaudio cudatoolkit=11.0 -c pytorch

最佳答案

提示短语/提升的 2 个潜在位置:

https://github.com/openai/whisper/blob/15ab54826343c27cfaf44ce31e9c8fb63d0aa775/whisper/decoding.py#L87-L88 :在 prompt 中添加提示短语(而不是在 prefix 中:请参阅此 discussion 关于 prompt 与 prefix。有一个 new --initial_prompt 自 commit 2037b65 选项:
```
whisper audio.mp3 --initial\_prompt "So we were just talking about DALL·E"
```
https://github.com/openai/whisper/blob/15ab54826343c27cfaf44ce31e9c8fb63d0aa775/whisper/decoding.py#L302 :更改代码以增加包含提示短语的序列的可能性，e.g. :

Currently there's no interface for this other than giving the initial_prompt like the above; you could hack something with logit biasing, that effectively boosts the predicted probability of certain tokens. The LogitFilter class is designed to support this.

我不知道它的效率如何。此外，当提示词不在词典中时，会出现一个潜在问题，在这种情况下，需要将提示词添加到词典中，这可能很困难。

关于python - 如何给 OpenAI 的 Whisper ASR 一些提示短语？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/73833916/

25

4

0

文章推荐： java - Selenium Webdriver 和 Firefox Server Not Found 错误

文章推荐： Java SQLPreparedStatement和维护连接

文章推荐： lua - 当 key 正确时，OpenAI API 返回 "unauthorized"错误

Haskell 提示/为什么这不是线性缩放？
我的 friend 编写了一个程序，它比较随机排列的骰子面，以找到分布最均匀的面——尤其是当面不仅仅是序列时。我将他的程序翻译成 haskell 是因为我一直在寻找一个理由来让别人知道 haskel
Yii:模型属性的注释/提示
我需要对表单中的某些字段进行评论/提示。我的想法是在模型中描述它，就像attributeLabels一样。我该怎么做？然后它会是理想的，如果 Gii 模型(和 Crud)生成器直接从 mysql 列
delphi - 如何处理第三方库中的警告/提示？
我们使用 FastReport 来生成报告。事实上，我们为访问源代码付费。我们目前使用的是 FastReport 的最新稳定版本。虽然它对于我们的生产来说足够稳定，但每当我编译时，我都会看到以下内容
WPF:创建对话框/提示
我需要创建一个对话框/提示，包括用于用户输入的文本框。我的问题是，确认对话框后如何获取文本？通常我会为此创建一个类，将文本保存在属性中。不过我想使用 XAML 设计对话框。因此，我必须以某种方式扩展
php - 提示/警告用户删除按钮并运行脚本进行删除
我想提示用户是否要执行操作(删除) - 用警报框说"is"或“否”，如果是，则运行删除脚本，如果否，则不执行任何操作我不太了解 javascript，因此是否有人可以使用 javascript 获得
Javascript 在函数后不断变得未定义 - 提示
所以我正在编写一个简单的 JS 代码。我们刚刚开始学习函数。我需要创建一个名为“printStars”的函数。我需要从用户那里获取一个号码，并根据该号码打印“*”。这就是我所做的:
在页面显示之前加载 Javascript 提示
我在我的页面上添加了一个提示，但它在页面加载之前加载了。如何仅在整个页面可见时才显示消息？这是我的提示: if (name == null || name == "") { txt == "No
在页面显示之前加载 Javascript 提示
我在我的页面上添加了一个提示，但它在页面加载之前加载了。如何仅在整个页面可见时才显示消息？这是我的提示: if (name == null || name == "") { txt == "No
zsh 提示 - 检查是否有任何后台作业
我正在自定义我的 zsh 提示，并发现以下内容来检查是否有任何后台作业: if [[ $(jobs | wc -l) -gt 0 ]]; then # has background job(s)
JavaScript 提示/警报问题
这个问题在这里已经有了答案: JavaScript object: access variable property by name as string [duplicate] (3 个答案) pa
没有出现 JavaScript 提示
我正在尝试用 javascript 制作一个简单的数学练习程序。在提示警报中给出不同的值，并将答案与用户输入进行比较。这是代码: Calculations generate(); functio
android - 如何在编辑文本的中心对齐文本(提示)
在这段代码中，尽管我使用了文本对齐属性在“编辑文本” View 的中心设置“提示”。但它无法正常工作。最佳答案尝试关于android - 如何在编辑文本的中心对齐文本(提示)，我们在Sta
java - 提示 EditText
我正在尝试让我的 EditText 显示一个提示，例如“请在此处输入答案”，当用户点击 EditText 以键入他们的答案时，文本应该消失并留空，以便他们在其中输入答案. 截至目前，这就是我的 .xm
Android Spinner 提示？
我当前的 android 应用程序中有两个微调器，我想要一个默认值，例如 editText 的 android:hint 功能。有没有办法这样做，但不会将提示添加到填充微调器的字符串数组。例如从微调器
带名称的 JavaScript 提示
如果我的表单已完全填写，我如何提示“感谢您填写表单，“name”!” function submit_onclick() { if(confirm("Thanks for completing t
JavaScript 提示()命令
我刚刚了解了prompt()命令；我知道 Prompt() 命令以字符串的形式返回用户输入。我正在搞乱下面的程序，我输入了Per“Dead”Ohlin作为男性名字。为什么这有效并且没有引起任何问题？
提示 FILE * 未初始化
void openUpNow(FILE *x, FILE *y) { x = fopen("xwhatever", "r"); y = fopen("ywhatever", "r");
JavaScript 提示() 方法
我有一个作业正在处理，但我在使用 prompt() 方法时遇到了问题。我看到我可以做一个提示，但我需要几个并且有数量。例如... 我创建了一个 HTML 表格，其中包含许多艺术家和包含 DVD、CD
ios - 我对这个练习的解决方案似乎太简单了；提示？
我正在学习 Big Nerd Ranch 的 iOS Programming, 2nd Edition，我已经来到第 4 章挑战:标题。该练习暗示我感到困惑；它说我需要做一些我认为不需要做的事情。到
PHPUnit 提示 Selenium
抱歉，如果这是微不足道的，但我没有找到任何解决此问题的建议。我在 Ubuntu 上，我的 Yii 项目需要 PHPUnit。我已经安装了 PHPUnit 两次，方法是下载 phpunit.phar 并

首页

博学

6Ren·AI

商城

python - 如何给 OpenAI 的 Whisper ASR 一些提示短语？