gpt4 book ai didi

audio - 使用Google Speech API,音频文件格式出现问题

转载 作者:行者123 更新时间:2023-12-02 22:37:59 25 4
gpt4 key购买 nike

希望你一切都好,

我正在尝试使用Google Speech API将我直接进行的采访转换为文本文件。

我正在尝试启动并运行环境,因此正在使用一个文件对其进行测试:
我对音频真的很陌生,所以我使用在线转换器将测试文件转换为FLAC:http://www.online-convert.com/
然后,我使用ffprobe进行验证,对我来说看起来不错,

Input #0, flac, from '../../Walk_Away.flac':
Metadata:
MAJOR_BRAND : mp42
MINOR_VERSION : 0
COMPATIBLE_BRANDS: isommp42
ARTIST : Aaron Michael Cox
TITLE : Walk Away
ENCODER : Lavf57.57.100
Duration: 00:03:12.08, start: 0.000000, bitrate: 185 kb/s
Stream #0:0: Audio: flac, 16000 Hz, mono, s16
[FORMAT]
filename=../../Walk_Away.flac
nb_streams=1
nb_programs=0
format_name=flac
format_long_name=raw FLAC
start_time=0.000000
duration=192.078375
size=4444256
bit_rate=185101
probe_score=50
TAG:MAJOR_BRAND=mp42
TAG:MINOR_VERSION=0
TAG:COMPATIBLE_BRANDS=isommp42
TAG:ARTIST=Aaron Michael Cox
TAG:TITLE=Walk Away
TAG:ENCODER=Lavf57.57.100
[/FORMAT]

但是,当我尝试:
node recognize.js async-gcs gs://file.flac -e LINEAR16 -r 16000
我收到一个非常可悲的结果:“转录:”

有人可以帮我吗?非常感谢
伊万

最佳答案

问题在于该文件是FLAC文件,但是在命令中您指定了它是原始音频文件(LINEAR16)。再试一次,但是使用-e FLAC选项将其指定为FLAC文件,看看是否有帮助。因此,命令应如下所示:

node recognize.js async-gcs gs://file.flac -e FLAC -r 16000

或者,您可以将音频文件转换为原始音频文件。

关于audio - 使用Google Speech API,音频文件格式出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42712565/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com