- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Mac,并尝试使用 python 和 Blackhole 捕获 Zoom 音频输出作为 Azure 语音翻译模型的输入。
并将 Azure Translation_recognizer 对象设置为“多输出设备”
但是,当我将 AutoConfig 的 device_name 设置为虚拟设备时,我收到一个运行时错误,我不明白该错误,并且似乎无法在任何地方找到建议。
堆栈跟踪:
/usr/local/bin/python3.9 /Users/sethhammock/Scripts/translate_speech_continuous.py
SESSION STARTED: SessionEventArgs(session_id=116958757375422f9b8f5c6a31aed3c9)
Traceback (most recent call last):
File "/Users/sethhammock/Scripts/translate_speech_continuous.py", line 48, in <module>
translation_recognizer.start_continuous_recognition()
File "/usr/local/lib/python3.9/site-packages/azure/cognitiveservices/speech/speech.py", line 664, in start_continuous_recognition
return self._impl.start_continuous_recognition_async().get()
File "/usr/local/lib/python3.9/site-packages/azure/cognitiveservices/speech/speech_py_impl.py", line 1978, in get
return _speech_py_impl.VoidFuture_get(self)
RuntimeError: Exception with an error code: 0x15 (SPXERR_MIC_ERROR)
[CALL STACK BEGIN]
3 libMicrosoft.CognitiveServices.Spee 0x00000001093c464e GetModuleObject + 716126
4 libMicrosoft.CognitiveServices.Spee 0x00000001094322fe GetModuleObject + 1165838
5 libMicrosoft.CognitiveServices.Spee 0x0000000109442c41 GetModuleObject + 1233745
6 libMicrosoft.CognitiveServices.Spee 0x000000010943cabc GetModuleObject + 1208780
7 libMicrosoft.CognitiveServices.Spee 0x000000010943c3c2 GetModuleObject + 1206994
8 libMicrosoft.CognitiveServices.Spee 0x0000000109439941 GetModuleObject + 1196113
9 libMicrosoft.CognitiveServices.Spee 0x0000000109546d1a _ZN13FileBlobWrite11WriteToFileEPviPKc + 671994
10 libMicrosoft.CognitiveServices.Spee 0x0000000109543e52 _ZN13FileBlobWrite11WriteToFileEPviPKc + 660018
11 libMicrosoft.CognitiveServices.Spee 0x00000001094b2f5f _ZN13FileBlobWrite11WriteToFileEPviPKc + 66367
12 libMicrosoft.CognitiveServices.Spee 0x00000001094b08c2 _ZN13FileBlobWrite11WriteToFileEPviPKc + 56482
13 libMicrosoft.CognitiveServices.Spee 0x00000001094cefb6 _ZN13FileBlobWrite11WriteToFileEPviPKc + 181142
14 libMicrosoft.CognitiveServices.Spee 0x0000000109329fc6 GetModuleObject + 83670
15 libMicrosoft.CognitiveServices.Spee 0x0000000109329f59 GetModuleObject + 83561
16 libMicrosoft.CognitiveServices.Spee 0x000000010932be2b GetModuleObject + 91451
17 libMicrosoft.CognitiveServices.Spee 0x000000010932a113 GetModuleObject + 84003
18 libMicrosoft.CognitiveServices.Spee 0x000000010932d4f8 GetModuleObject + 97288
19 libsystem_pthread.dylib 0x00007ff8035464e1 _pthread_start + 125
[CALL STACK END]
Process finished with exit code 1
我认为运行时错误是由于 16Hz 的采样率造成的,但使用 Blackhole,可以使用简单的 GUI 轻松配置。
我发现 AudioConfig 需要携带 ALSA 样式的 device_name=device_name,但是,我认为它不会在 Mac OS 上工作,因为尝试在 cmd 行上安装 alsa-lib 会显示“。 ..这需要 Linux”。
ALSA 风格的设备名称类似于 hw:X,Y,其中 X 是设备,Y 是卡号(如果我理解正确的话)。 ALSA 显然可以在 Debian 上运行,但不能在 BSD 上运行,而 BSD 正是 Mac OS 的基础,所以我这样做是在浪费时间吗?
任何人都可以帮助我了解如何设置speechsdk.audio.AudioConfig(device_name="Blackhole 16ch") 或peechsdk.audio.AudioConfig(device_name="hw:0,2")
或者如果我在设备命名约定方面遗漏了一些我想要实现的目标?
我尝试使用文件来读取,效果很好!它只是读取我的音频文件并返回翻译结果。
那么,由于没有 ALSA 风格的命名约定,命名设备无法工作,是否会将音频流写入文件,并让 Azure 在工作中读取它?
非常感谢任何想法!
最佳答案
我使用这些工具来检查 https://github.com/jimbobbennett/AudioIds
我编译代码来获取我的 blackhoide 设备名称
2022-09-26 14:39:03.339591+0800 AudioIds[5533:2695040] {
deviceName = "BlackHole 16ch";
deviceUID = "BlackHole16ch_UID";
}
我和你有同样的申请。我使用该设置,它可以与我一起转录。
audio_config = speechsdk.audio.AudioConfig(device_name="BlackHole16ch_UID")
关于python - 使用 python 将视频 session 中的音频流传输到 azure 语音翻译,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73282571/
我一直在做一些关于测量数据传输延迟的实验 CPU->GPU 和 GPU->CPU。我发现对于特定消息大小,CPU->GPU 数据传输速率几乎是 GPU->CPU 传输速率的两倍。谁能解释我为什么会这样
我将 ElasticSearch 用作我的 Post 模型的 Rails pet 项目应用程序的全文引擎。在我的 posts_controller.rb 索引操作中: def index
概述 流经网络的数据总是具有相同的类型:字节,这些字节如何传输主要取决于我们所说的网络传输。用户并不关心传输的细节,只在乎字节是否被可靠地发送和接收 如果使用 Java 网络编程,你会发现,某些时候当
我正在编写一些代码,以便将共享点从该页面转移到另一个页面: Server.Transfer("/DefectManagement/DefectList/default.aspx") 但是我遇到了这个问
我有这个泄漏,任何猜测?这个类有一些奇怪的引用。我的代码的任何地方都没有 contentobserver In com.example:1.5.0:27. com.example.ui.record
我听说过点对点内存传输并阅读了一些关于它的内容,但无法真正理解与标准 PCI-E 总线传输相比它的速度有多快。 我有一个使用多个 GPU 的 CUDA 应用程序,我可能对 P2P 传输感兴趣。我的问题
ftping 文件时,Transmit 中是否有忽略或过滤器列表?我希望它忽略上传 .svn 文件等。 最佳答案 是的。转到首选项并选择 Rules标签。在那里您可以定义要跳过哪些文件的规则。实际上,
我有以下片段来生成声音,在 while 循环中,我想动态更改它,以便它在声音生成期间创建不同频率的声音。 for(uint16_t i = 0; i < sample_N; i++) { da
我正在尝试使用 Delphi 2010 和 Indy 对 Web 服务进行概念验证。我此时的代码是: procedure TForm1.Log(const sEvent, sMsg: String);
我有一个 ActiveMQ JMS 代理,在端口 61616 上使用默认的 openwire TCP 传输公开。 我有许多远程客户端可以绑定(bind)到此代理来监听他们的消息。 如果我想打开 kee
reconnection strategies文档仅使用 JMS 示例,但是 FTP transport documentation确实说明了重新连接策略的使用,但没有任何细节或示例。 进一步,如果你
我有 2 个 TreeView,第一个填充有项目。 try { CheckBoxTreeItem treeRoot = new CheckBoxTreeItem("Root"); tr
在我为学校开发的一个网站上,用户输入他们的学校电子邮件和密码,如果他们已注册,则登录。如果没有,则会显示登录的第二部分,要求输入笔名称并确认密码。正因为如此,以及我复杂的业余 Django 编程,我有
我正在开发一个 Web 服务,我们在其中使用 LINQ-to-SQL 进行数据库抽象。当客户使用我们的网络服务时,对象被序列化为 XML,一切都很好。 现在我们希望开发我们自己的使用本地数据类型的客户
我应该创建一个名为“Backwards”的方法,该方法将列表从尾部横向到头部,但是当我运行代码时,它出现说(第 88 行)它找不到光标 = cusor.prev;象征。我需要在循环中再次设置上一个链接
给定像 Uint8Array 这样的类型化数组,似乎有两种方法可以通过 worker 传输它们。 选项 1 直接发送缓冲区并在接收端进行转换: 发件人:postMessage({fooBuffer:
在 PHP + jQuery 环境中,我和我的 friend 无法得出最佳解决方案。我们正在使用 Ajax 从数据库中获取数据。 解决方案 1 - Ajax 应该只传输数据,而不是 HTML 好处:我
大家好,非常感谢您的宝贵时间。 有一个 std::stringstream 需要传输到远程机器。网络库允许我用以下方法构建数据包: CreatePacket( const void * DATA, s
我正在使用 libcurl 通过 FTP 传输二进制文件 (.exe),并将其保存到本地文件。问题是文件传输后,它已被更改,不再是有效的 Win32 应用程序,因此无法运行。这是我的做法: CURL
各位程序员, 当我将它上传到我的 FTP 时,我的网站出现此错误:资源被解释为样式表,但使用 MIME 类型文本/纯文本传输 BlahBlahi
我是一名优秀的程序员,十分优秀!