- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在研究 Google 云语音转文本示例。我从此链接 GoogleCloudPlatform speech to text sample 中获取了样本我提到了Quickstart: Using Client Libraries该示例中给出的示例文件工作正常。它给出了该音频文件的文本。但是如果我提供自己的音频文件,它不会返回任何内容。
云请求包括音频文件、AudioEncoding 和 SampleRateHertz。问题可能出在我自己的音频文件的 AudioEncoding 和 SampleRateHertz 中。
如何识别音频文件的AudioEncoding和SampleRateHertz?
最佳答案
AudioEncoding
的 Java 枚举具有以下可能的值:
AudioEncoding.AMR
-> .awb/.3gp 文件
AudioEncoding.AMR_WB
-> .awb/.3gp 文件
AudioEncoding.FLAC
-> .flac 文件
AudioEncoding.LINEAR16
-> .wav 文件
AudioEncoding.MULAW
-> .wav 文件
AudioEncoding.OGG_OPUS
-> .ogg/.opus 文件
AudioEncoding.SPEEX_WITH_HEADER_BYTE
-> 没有线索,也许.speex
因此,您可以通过文件扩展名进行初步猜测,对于 SampleRateHertz
,您可以使用类似 Tika by Apache 的工具。 。这将为 commercial_stereo.wav 输出以下内容:
Content-Length: 6305632
Content-Type: audio/vnd.wave
X-Parsed-By: org.apache.tika.parser.DefaultParser
X-Parsed-By: org.apache.tika.parser.audio.AudioParser
X-TIKA:digest:MD5: 7e3e8837273e8bb143533894926f7da3
X-TIKA:digest:SHA256: 98fac004fb662ad8f720e680c81e3b4c9dea20190f5d1d908cece2cd6b30f01e
bits: 16
channels: 2
encoding: PCM_SIGNED
resourceName: commercial_stereo.wav
samplerate: 44100.0
xmpDM:audioSampleRate: 44100
xmpDM:audioSampleType: 16Int
关于java - 如何识别音频文件的AudioEncoding和SampleRateHertz,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52992047/
我希望尽可能使用 MediaRecorder.AudioEncoder.HE_AAC。 但是,以下代码无法在某些设备中生成有效的音频文件,除非我使用 MediaRecorder.AudioEncode
我在 iOS 上使用 PhoneGap (Cordova) 的 AudioEncode 插件。在为较新版本的 Cordova 更新了几行之后,它似乎正确地将 wav 文件编码为 m4a。在 Xcode
我是一名优秀的程序员,十分优秀!