- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我尝试使用 Pocketsphinx 编写一些语音识别程序。
首先我构建了 sphinxbase 和 pocketsphinx。我可以从 cmd 启动 pocketsphinx_continuous 。我只想在 inmic 模式下使用它。
现在我尝试重写 c 源代码,所以我只有 inmic 模式。我用这段代码构建了一个 .dll 并尝试在 Eclipse 中运行它。
这是我的 Java 源代码
public class Test {
private native Test Decoder_defaultConfig();
private native void recognize_from_mic();
public static void main(final String[] args) {
final Test test = new Test().Decoder_defaultConfig();
test.recognize_from_mic();
}
static {
System.loadLibrary("pocketsphinx_Test");
}
}
以及生成的头文件:
/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
/* Header for class Test */
#ifndef _Included_Test
#define _Included_Test
#ifdef __cplusplus
extern "C" {
#endif
/*
* Class: Test
* Method: Decoder_defaultConfig
* Signature: ()LTest;
*/
JNIEXPORT jobject JNICALL Java_Test_Decoder_1defaultConfig
(JNIEnv *, jobject);
/*
* Class: Test
* Method: recognize_from_mic
* Signature: ()V
*/
JNIEXPORT void JNICALL Java_Test_recognize_1from_1mic
(JNIEnv *, jobject);
#ifdef __cplusplus
}
#endif
#endif
我将我的 c 源更改为:
#include <stdio.h>
#include <string.h>
#include <assert.h>
#include <jni.h>
#include <sphinxbase\cmd_ln.h>
#include <windows.h>
#include <sphinxbase/err.h>
#include <sphinxbase/ad.h>
#include "pocketsphinx.h"
#define MODELDIR "C:/Users/310086414/Desktop/pocketsphinx/pocketsphinx/bin/Release/x64/model"
const char * recognize_from_microphone();
static ps_decoder_t *ps;
static cmd_ln_t *config;
static FILE *rawfd;
ad_rec_t *ad;
int16 adbuf[2048];
uint8 utt_started, in_speech;
int32 k;
char const *hyp;
char const *decoded_speech;
JNIEXPORT void JNICALL Java_Test_Decoder_1defaultConfig(JNIEnv *env, jobject obj)
{
config = cmd_ln_init(NULL, ps_args(), TRUE, // Load the configuration structure - ps_args() passes the default values
"-hmm", MODELDIR "/en-us/en-us", // path to the standard english language model
"-lm", MODELDIR "/en-us/en-us.lm.bin", // custom language model (file must be present)
"-dict", MODELDIR "/en-us/cmudict_en_us.dict", // custom dictionary (file must be present)
NULL);
if (config == NULL) {
cmd_ln_free_r(config);
E_INFO("configuration failed");
}
ps = ps_init(config); // initialize the pocketsphinx decoder
if (ps == NULL) {
cmd_ln_free_r(config);
E_INFO("decoder failed");
}
ad = ad_open_dev("sysdefault", (int)cmd_ln_float32_r(config, "-samprate")); // open default microphone at default samplerate
while (1) {
decoded_speech = recognize_from_microphone(); // call the function to capture and decode speech
printf("You Said: %s\n", decoded_speech); // send decoded speech to screen
}
ad_close(ad); // close the microphone
}
const char * recognize_from_microphone() {
ad_start_rec(ad); // start recording
ps_start_utt(ps); // mark the start of the utterance
utt_started = FALSE; // clear the utt_started flag
while (1) {
k = ad_read(ad, adbuf, 4096); // capture the number of frames in the audio buffer
ps_process_raw(ps, adbuf, k, FALSE, FALSE); // send the audio buffer to the pocketsphinx decoder
in_speech = ps_get_in_speech(ps); // test to see if speech is being detected
if (in_speech && !utt_started) { // if speech has started and utt_started flag is false
utt_started = TRUE; // then set the flag
}
if (!in_speech && utt_started) { // if speech has ended and the utt_started flag is true
ps_end_utt(ps); // then mark the end of the utterance
ad_stop_rec(ad); // stop recording
hyp = ps_get_hyp(ps, NULL); // query pocketsphinx for "hypothesis" of decoded statement
return hyp; // the function returns the hypothesis
break; // exit the while loop and return to main
}
}
}
如果我现在使用 Eclipse 运行 Java 源代码,我会收到以下消息:
#
# A fatal error has been detected by the Java Runtime Environment:
#
# EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000023bfbfc, pid=9780, tid=0x0000000000002a38
#
# JRE version: OpenJDK Runtime Environment (8.0_74-b02) (build 1.8.0_74-b02)
# Java VM: OpenJDK 64-Bit Server VM (25.74-b02 mixed mode windows-amd64 compressed oops)
# Problematic frame:
# C [pocketsphinx.dll+0x1fbfc] ps_start_utt+0x1c
#
# Failed to write core dump. Minidumps are not enabled by default on client versions of Windows
#
# An error report file with more information is saved as:
# D:\sde\workspaceAW_4.5\pocketsphinx\hs_err_pid9780.log
#
# If you would like to submit a bug report, please visit:
# http://bugreport.java.com/bugreport/crash.jsp
# The crash happened outside the Java Virtual Machine in native code.
# See problematic frame for where to report the bug.
#
它说 ps_start_utt 中有任何问题,但我没有更改任何内容。使用sphinaxbase/pocketsphinx又出现错误了吗?
最佳答案
这部分
config = cmd_ln_init(NULL, ps_args(), "-inmic", "yes", TRUE, NULL);
if (config == NULL || cmd_ln_boolean_r(config, "-inmic") == FALSE) {
E_INFO("Specify '-inmic yes' to recognize from microphone.\n");
cmd_ln_free_r(config);
}
不太正确。 “-inmic”是pocketsphinx_continuous的一个选项,而不是sphinxbase的一个选项。应该很简单
config = cmd_ln_init(NULL, ps_args(), TRUE, NULL);
另外,cmd_ln_free_r(config)
之后需要退出程序,而不是继续执行。当您释放配置并稍后尝试使用它时,您会导致内存冲突。
关于java - Pocketsphinx 的 JNI 绑定(bind)中的访问冲突,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37028363/
我正在尝试制作一个 Python 应用程序,它可以使用 PyAudio、SpeechRecognition 和 PocketSphinx 录制音频并将其翻译成英文文本。我在 Mac OS X El C
我正在尝试安装 pocketsphinx 并出现以下错误: jandornhege@JanDornhegeUbuntu:~/Hermes/Basefunktions$ pip install pock
如何使用 pocketsphinx 从麦克风执行连续语音识别。如何在 C 中使用 gstreamer 插件 api? 最佳答案 how to perform continuous speech rec
我目前正在使用 Pocketsphix 演示(android 和 Visual Studio 2010)并且我已经配置了一个 jsgf 语法 像这样 #JSGF V1.0; grammar Nam
我终于设法构建并运行Pocketsphinx(pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我了解,您可以指定一个字典文件(-dict test.dic)。因此,我
我开始研究口袋狮身人面像。我有一个用于配置解码器的可能参数列表。但没有说明哪个参数负责哪个配置。在 tutorial CMUSphinx这只是其中的一小部分。这对我来说还不够。有人有资料,解释了哪些参
我正在尝试使用带有 PyDev 插件的 Eclipse (Juno) IDE 在 Windows 8 上开发 python 应用程序。 我已经设置了环境,并配有解释器。能够运行诸如“hello, wo
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
我在自定义 C++ 应用程序中使用 pocketshpinx 进行语音识别。我注意到有时 ps_get_hyp() 方法返回的假设字符串是一个空字符串。 问题:这是预期的行为吗?如果是这样,有没有办法
我重新访问了 CMU Sphinx最近并尝试为 Android 设置一个基本的热词检测器,从 tutorial 开始并调整 sample application . 我遇到了各种问题,尽管深入研究了他
我正在使用 pocketsphinx 和树莓派来实现家庭自动化。我用支持的命令编写了一个简单的 JSGF 语法文件。现在,我想在命令之前使用激活短语,例如“嘿计算机”,以避免错误检测,并且仅在说出激活
我一直在运行 Debian Squeeze 的虚拟机上安装 Pocketsphinx0.7。这工作得很好,我可以尝试识别文件中的语音。有了这个,我构建了一些 python 脚本,这些脚本可以识别我得到
我正在尝试提高 pocketsphinx 在嘈杂环境中的识别准确率。但是,用户可能会在可变环境中使用该应用程序。因此,噪声训练不是我想做的事情。 我的问题是,在将语音信号输入 pocketsphinx
我正在考虑为我的应用程序使用 Pocketsphinx 离线语音识别,但它的文档不清楚。如果有人可以给出以下问题的答案,那么它真的会对我有很大帮助。 setKeywordThreshold(1e-5f
我尝试开始使用 pocketsphinx 但收到此错误: gcc -I /home/noahchalifour/libraries/pocketsphinx/include -I /home/noah
我想在 android 中开发一个语音识别器。我用过 this thread和 this video在 Android 设备中使用语音识别。 这是我的代码: MainActivity.java: pa
我正在开发一个使用 pocketsphinx 的 android 应用程序。不幸的是识别准确率很差,因此我想将语法中的单词限制为真正需要的单词。 目前我使用的是 pocketsphinx 的演示应用程
在某些设备(不是实际测试设备)上,当我开始 PocketSphinx 识别时,我得到了一个强制关闭。我正在尝试从其中一台设备获取日志文件,但这很困难,因为我测试过的设备都没有出现此错误。让我知道从我的
我在 android 上使用 pocketsphinx 来识别关键字,但它无法识别所需关键字以外的任何其他关键字。而且它甚至不等我说话并在 logcat 中显示关键字。 这是我的代码: public
我在 ubuntu 11.10 上使用 pocketsphinx python 绑定(bind)。我将语法和音频文件传递给它,它运行良好。我现在正在寻找音频文件中每个单词的时间戳。我见过: void
我是一名优秀的程序员,十分优秀!