gpt4 book ai didi

ios - TLSphinx cmusphinx pocketsphinx 假设结果文本 空字符串 得分 负 (-) 数字

转载 作者:行者123 更新时间:2023-12-01 23:21:33 32 4
gpt4 key购买 nike

我运行了自述文件中的示例代码 tryolabs/TLSphinx README.md ,Hypothesis的text属性的结果是空格,而score属性的结果是负数-4420。

为什么我在假设的文本属性中没有得到好的结果?

这是我的代码:

let hmm = localDocumentsURL.path // Path to the acustic model
let lm = localDocumentsURL.appendingPathComponent("6844").appendingPathExtension("lm").path // Path to the languaje model
let dict = localDocumentsURL.appendingPathComponent("cmudict-en-us").appendingPathExtension("dict").path // Path to the languaje dictionary

if let config = Config(args: ("-hmm", hmm), ("-lm", lm), ("-dict", dict)) {
if let decoder: TLSphinx.Decoder = TLSphinx.Decoder(config:config) {

let audioFile = Bundle.main.path(forResource: "audio16000", ofType: "wav")! // Path to an audio file

do {
try decoder.decodeSpeech(atPath: audioFile) {

if let hyp: Hypothesis = $0 {
// Print the decoder text and score
print("Text: \(hyp.text) - Score: \(hyp.score)")
} else {
// Can't decode any speech because of an error
}
}
} catch {
print(error)
}
} else {
// Handle Decoder() fail
print("Decoder fail")
}
} else {
// Handle Config() fail
print("Config fail")
}

调试窗口中的文本字符数超出了堆栈溢出允许的字符数,因此我不显示它。

我仍然得到与使用 mp3 文件时相同的结果,除了当我使用 mp3 文件时,我得到一个空字符串而不是空格。我使用 Audacity 将 mp3 文件转换为 16000 Hz 采样率、签名 16 位 PCM 格式、16 位深度和单声道音频 channel 的 wav。这些是所需的规范。

最佳答案

Why is the text empty?

您使用的输入文件格式错误,它应该是 wav,而不是 mp3

Why is the score so low?

它不低,预计为负,因为它是对数分数

How would I fix this so that I get a text result and a high score?

使用正确的输入格式

关于ios - TLSphinx cmusphinx pocketsphinx 假设结果文本 空字符串 得分 负 (-) 数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57210017/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com