mp3 - Google Cloud Speech-to-Text(MP3 到文本)-6ren

mp3 - Google Cloud Speech-to-Text(MP3 到文本)

转载作者：行者123 更新时间：2023-12-04 16:06:39

26

4

我正在使用 Google Cloud Platform Speech-to-Text API 试用帐户服务。我无法从音频文件中获取文本。我不知道我应该对比特率为 128kbps 的 MP3 文件使用什么确切的编码和采样率赫兹。我尝试了各种选择，但我没有得到转录。

const speech = require('@google-cloud/speech');

const config = {
  encoding: 'LINEAR16',  //AMR, AMR_WB, LINEAR16(for wav)
  sampleRateHertz: 16000,  //16000 giving blank result.
  languageCode: 'en-US'
};

最佳答案

测试版现在支持 MP3:

MP3 Only available as beta. See RecognitionConfig reference for details.

https://cloud.google.com/speech-to-text/docs/encoding

MP3 MP3 audio. Support all standard MP3 bitrates (which range from 32-320 kbps). When using this encoding, sampleRateHertz can be optionally unset if not known.

https://cloud.google.com/speech-to-text/docs/reference/rest/v1p1beta1/RecognitionConfig#AudioEncoding

您可以使用各种工具(例如 iTunes)找出采样率。 CD 品质的音频使用 44100 赫兹的采样率。在此处阅读更多信息:

https://en.wikipedia.org/wiki/44,100_Hz

要在 Google SDK 中使用它，您可能需要使用定义它的 Beta SDK 之一。这是 Go Beta SDK 中的常量:

RecognitionConfig_MP3 RecognitionConfig_AudioEncoding = 8

https://godoc.org/google.golang.org/genproto/googleapis/cloud/speech/v1p1beta1

关于mp3 - Google Cloud Speech-to-Text(MP3 到文本)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47826977/

26

4

0

文章推荐： google-cloud-messaging - 每个项目的 Google Cloud PubSub 订阅限制

文章推荐： xmlstarlet - 如何开始学习 XMLSTARLET？

文章推荐： Java Spring Hibernate - 没有来自 HTML 表单的波兰语字母

android - mp.release崩溃的音板应用程序
我正在使用以下代码播放声音，过一会儿它将停止播放声音，这是因为我相信有太多的Mediaplayer打开实例，所以我添加了一个额外的mp.release();，这只会使我的应用程序崩溃(目前已被注释掉)
c - MP 浮点结构
我正在查看 XV-6 代码，它通过它识别 MP 结构。它首先在 EBDA 的第一个 kb 中搜索。代码是这样的 static struct mp* mpsearch(void) { uchar *
android - Mp 饼图大小增加
我在我的应用程序中使用 Mp 饼图。它显示非常小的尺寸，我试图增加它的尺寸但它没有增加它的尺寸。我无法找出问题所在。请告诉我们如何增加尺寸。这是我的代码: public class MPpiecha
Android MP 饼图如何从饼图中删除文本和值
如何使用 MPAndroidChart 实现此目的？使用版本:com.github.PhilJay:MPAndroidChart:v3.1.0-alpha 添加图例和饼图边距的代码: private
android - Mp android图表，带条形渐变背景的条形图
亲爱的社区，我面临以下问题，我正在使用此处提供的 MP android 图表库创建条形图:https://github.com/PhilJay/MPAndroidChart . 我想为我的条设置渐变背
SAS MP(多处理)连接
我正在使用 SAS MP Connect 开发我的第一段代码，以运行同一个 sas 作业的并行线程。我知道 MP CONNECT 仅受可用 CPU 数量的物理限制，但理想情况下我不想在我的工作中使用
stata - 寻找一个示例程序来测试 Stata/MP
我最近购买了在 Linux 服务器上运行的 Stata MP12(8 核)许可证。有没有人写过 Stata 程序，比如说模拟研究来测试 Stata MP 的性能？我想监视在作业处理过程中实际使用的内
azure 而不是 LA(MP)
我将不胜感激任何“一步一步”指南，说明如何更改 PHP/HTML 页面上的动态数据库连接/连接字符串/等上的代码，使其“即插即用”工作通过 ftp 将页面和 MySQL 数据库托管在“Azure 网站
android - mp.pause();使应用程序崩溃
试图在我的应用程序中放置一个“暂停”按钮，以播放一些声音片段循环播放。当我打电话mp.pause();一切都破了，我完全迷路了! 这是我正在使用的方法。 protected void man
Android Mp Android 图表定制设计
我想使用 Mp Chart 创建折线图我想要实现的是这张图片但是到目前为止我已经得到了这个。我使用的代码是这个 private fun setData() { val entries
c++ - Open MP:SIMD循环中的SIMD兼容功能？
通常，我可能会编写一个类似simd的循环: float * x = (float *) malloc(10 * sizeof(float)); float * y = (float *) malloc
Fortran、Open MP、间接递归和有限的堆栈内存
在与堆栈空间、OpenMP 以及如何处理这些问题相关的其他帖子上，有很多回复。但是，我找不到信息来真正理解 OpenMP 调整编译器选项的原因: 原因是什么-fopenmp在 gfortran 中暗示
c - 打开 MP 代码无法按预期使用数学函数
我有一段代码，可以根据漂移、波动性和随机数计算任意给定日期的股票价格。但是当我检查输出列表时 - 它们是算术级数，而不是几何级数(幂函数)。我共享的变量有问题吗？代码如下: #include #i
c++ - 打开 MP 导致内存泄漏
我正在尝试在 C++11 中并行化动态编程算法使用这种方法: void buildBaseCases() { cout << "Building base cases" << endl
c - 打开 MP - 点积
我正在 open MP 中实现并行点积我有这个代码: #include #include #include #include #include #include #define SIZE
linux - SA-MP 服务器在启动时崩溃
我有一台服务器已经将近 4 年了，直到现在我都没有遇到任何问题(主机端)。我一直在更换主机，因为 ddos 的东西试图找到最适合我的东西。现在我买了一个 VPS(这不是我的第一个)并尝试运行我的服
c++ - 打开 Mp 嵌套并行
所以我有两个内部平行区域的外部平行区域。是否可以将 2 个线程放入外部平行线，将 4 个线程放入每个内部平行线？我做了这样的东西，但它似乎无法按照我想要的方式工作。有什么建议吗？ start_r =
c++ - MSVC10/MP 在项目中跨文件夹构建非多核
我希望有人指出我们遇到的问题或解决方法。使用/MP 编译项目时，似乎只有同一文件夹中的文件会同时编译。我使用 Process Explorer 滑动命令行并确认行为。项目过滤器似乎对并发编译的内容
me.chanjar.weixin.mp.api.WxMpMessageRouter类的使用及代码示例
本文整理了Java中me.chanjar.weixin.mp.api.WxMpMessageRouter类的一些代码示例，展示了WxMpMessageRouter类的具体用法。这些代码示例主要来源于G
stata - 如何在 Stata/MP 上生成多核负载？
我正在监视 Stata/MP(Stata/SE 的多核版本)的 CPU 和内存使用情况，但我不是 Stata 程序员(更像是 Perl 人)。任何人都可以发布一些代码，利用公共(public)数据集

首页

博学

6Ren·AI

商城

mp3 - Google Cloud Speech-to-Text(MP3 到文本)