gpt4 book ai didi

python - 如何在 python 中将 pocketsphinx (5prealpha) 与 gstreamer-1.0 一起使用?

转载 作者:行者123 更新时间:2023-11-28 17:29:48 26 4
gpt4 key购买 nike

我正在尝试创建一个小的 Python 脚本,它将通过网络接收音频流,通过 pocketspinx 将其馈送以将语音转换为文本,并根据 pocketsphinx 的输出运行一些命令。

我已经在 Ubuntu 15.10 虚拟机上安装了 sphinxbase 和 pocketsphinx (5prealpha),并且能够在 Python 中正确处理示例音频文件(pocketsphinx 安装的一部分)的内容。所以我有理由相信我的 sphinx 安装工作正常。不幸的是,测试 python 脚本无法处理连续音频并使用 native pocketsphinx API。根据 cmusphinx 网站,我应该使用 gstreamer 进行连续翻译。不幸的是,关于如何在 Python 中将 pocketsphinx 与 gstreamer 结合使用的信息相当有限。根据我能找到的示例,我拼凑了以下脚本。

import gi
gi.require_version('Gst', '1.0')
from gi.repository import GObject, Gst
GObject.threads_init()
Gst.init(None)

def element_message( bus, msg ):
msgtype = msg.get_structure().get_name()
if msgtype != 'pocketsphinx':
return
print "hypothesis= '%s' confidence=%s\n" % (msg.get_structure().get_value('hypothesis'), msg.get_structure().get_value('confidence'))

pipeline = Gst.parse_launch('udpsrc port=3000 name=src caps=application/x-rtp ! rtppcmadepay name=rtpp ! alawdec name=decoder ! queue ! pocketsphinx name=asr ! fakesink')

asr = pipeline.get_by_name("asr")
asr.set_property("configured", "true")

bus = pipeline.get_bus()
bus.add_signal_watch()
bus.connect('message::element', element_message)

pipeline.set_state(Gst.State.PLAYING)

# enter into a mainloop
loop = GObject.MainLoop()
loop.run()

发送方看起来像:

import gobject, pygst
pygst.require("0.10")
import gst

pipeline = gst.parse_launch('alsasrc ! audioconvert ! audioresample ! alawenc ! rtppcmapay ! udpsink port=3000 host=192.168.13.120')
pipeline.set_state(gst.STATE_PLAYING)
loop = gobject.MainLoop()
loop.run()

这应该从网络接收一个 udp 流,将其馈送到 pocketsphinx 并将输出打印到终端。如果我更换“队列!口袋狮身人面像! fakesink'部分由'wavenc! filesink',我确实得到了一个内容正确的有效音频文件,所以我知道网络发送部分工作正常。 (我的测试机器上没有音频,所以我无法使用本地音频源进行测试)。

当我启动脚本时,我看到 pocketspinx 配置经过,但随后脚本似乎不再执行任何操作。当我使用 GST_DEBUG=*:4 启动脚本时,我看到以下输出:

0:00:04.789157687  2220      0x86fff70 INFO               GST_EVENT gstevent.c:760:gst_event_new_segment: creating segment event time segment start=0:00:00.000000000, offset=0:00:00.000000000, stop=99:99:99.999999999, rate=1.000000, applied_rate=1.000000, flags=0x00, time=0:00:00.000000000, base=0:00:00.000000000, position 0:00:00.000000000, duration 99:99:99.999999999
0:00:04.789616981 2220 0x86fff70 INFO basesrc gstbasesrc.c:2838:gst_base_src_loop:<src> marking pending DISCONT
0:00:04.789995780 2220 0x86fff70 INFO GST_EVENT gstevent.c:760:gst_event_new_segment: creating segment event time segment start=0:00:00.000000000, offset=0:00:00.000000000, stop=99:99:99.999999999, rate=1.000000, applied_rate=1.000000, flags=0x00, time=0:00:00.000000000, base=0:00:00.000000000, position 0:00:04.079311489, duration 99:99:99.999999999
0:00:04.790420834 2220 0x86fff70 INFO GST_EVENT gstevent.c:679:gst_event_new_caps: creating caps event audio/x-raw, format=(string)S16LE, layout=(string)interleaved, rate=(int)8000, channels=(int)1
0:00:04.790851965 2220 0x86fff70 WARN GST_PADS gstpad.c:3989:gst_pad_peer_query:<decoder:src> could not send sticky events
0:00:04.791258320 2220 0x86fff70 WARN basesrc gstbasesrc.c:2943:gst_base_src_loop:<src> error: Internal data flow error.
0:00:04.791572605 2220 0x86fff70 WARN basesrc gstbasesrc.c:2943:gst_base_src_loop:<src> error: streaming task paused, reason not-negotiated (-4)
0:00:04.791917073 2220 0x86fff70 INFO GST_ERROR_SYSTEM gstelement.c:1837:gst_element_message_full:<src> posting message: Internal data flow error.
0:00:04.792305347 2220 0x86fff70 INFO GST_ERROR_SYSTEM gstelement.c:1860:gst_element_message_full:<src> posted error message: Internal data flow error.
0:00:04.792633841 2220 0x86fff70 INFO task gsttask.c:315:gst_task_func:<src:src> Task going to paused

根据我在谷歌上找到的信息和示例,我不明白出了什么问题。

如有任何帮助,我们将不胜感激。

妮可

最佳答案

Gstreamer 元素需要 16000 khz 音频,您正在尝试超过 8000。您必须修改 pocketsphinx 源以在 pocketsphinx 元素中启用 8000。您需要更新元素规范率、pocketsphinx 的采样率配置参数和声学模型。

或者,您需要通过网络发送宽带音频。在这种情况下,您不应使用非法编解码器。

关于python - 如何在 python 中将 pocketsphinx (5prealpha) 与 gstreamer-1.0 一起使用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35232989/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com