- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要从麦克风录制音频并将其转换为文本。我已经使用从网上下载的几个音频剪辑尝试了这个转换过程,它工作正常。但是,当我尝试转换从麦克风录制的音频剪辑时,会出现以下错误。
回溯(最近一次通话最后):
文件“C:\Users\HP\AppData\Local\Programs\Python\Python37\lib\site-packages\speech_recognition__init__.py”,第 203 行,位于 输入
self.audio_reader = wave.open(self.filename_or_fileobject, "rb")
文件“C:\Users\HP\AppData\Local\Programs\Python\Python37\lib\wave.py”,第 510 行,打开
返回 Wave_read(f)
文件“C:\Users\HP\AppData\Local\Programs\Python\Python37\lib\wave.py”,第 164 行,位于 初始化
self.initfp(f)
文件“C:\Users\HP\AppData\Local\Programs\Python\Python37\lib\wave.py”,第 144 行,在 initfp
self._read_fmt_chunk( block )
_read_fmt_chunk 中的文件“C:\Users\HP\AppData\Local\Programs\Python\Python37\lib\wave.py”,第 269 行
raise Error('未知格式: %r' % (wFormatTag,))
wave.Error:未知格式:3
我正在尝试的代码如下。
import speech_recognition as sr
import sounddevice as sd
from scipy.io.wavfile import write
# recording from the microphone
fs = 44100 # Sample rate
seconds = 3 # Duration of recording
myrecording = sd.rec(int(seconds * fs), samplerate=fs, channels=2)
sd.wait() # Wait until recording is finished
write('output.wav', fs, myrecording) # Save as WAV file
sound = "output.wav"
recognizer = sr.Recognizer()
with sr.AudioFile(sound) as source:
recognizer.adjust_for_ambient_noise(source)
print("Converting audio file to text...")
audio = recognizer.listen(source)
try:
text = recognizer.recognize_google(audio)
print("The converted text:" + text)
except Exception as e:
print(e)
最佳答案
您以浮点格式编写了文件:
soxi output.wav
Input File : 'output.wav'
Channels : 2
Sample Rate : 44100
Precision : 25-bit
Duration : 00:00:03.00 = 132300 samples = 225 CDDA sectors
File Size : 1.06M
Bit Rate : 2.82M
Sample Encoding: 32-bit Floating Point PCM
import numpy as np
myrecording = sd.rec(int(seconds * fs), samplerate=fs, channels=2)
sd.wait() # Wait until recording is finished
write('output.wav', fs, myrecording.astype(np.int16)) # Save as WAV file in 16-bit format
关于python - wave.Error : unknown format: 3 arises when trying to convert a wav file into text in Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60352850/
我的目标是编写一个函数来计算低于某个数字“n”的最大 Collatz 数。 (对于熟悉的人来说,这是一个欧拉计划问题。) 一些上下文:给定整数的 Collatz 数等于该整数的 Collat
我在 .hs 文件中有以下代码 module TypeInference1 where f :: Num a => a -> a -> a f x y = x + y + 3 然后,如果我检查 的类型
我尝试运行代码来使用 java swing 库创建 GUI,以将消息发送到本地主机服务器。GUI 包含一个用于键入消息的文本字段和一个用于将其发送到服务器的按钮。包含服务器代码在另一个类(class)
有人知道为什么下面的代码在“matchListWith eq [] []”中失败吗? --失败.hs matchListWith :: (Eq a) => (a -> a -> Bool) -> [a
我是 Haskell 的新手,遇到这个错误时遇到了一些麻烦。我在 Windows 上使用 ghci。这是代码: data Direction = North | South | East | West
考虑以下函数: foo :: Show a => Maybe a -> [Char] foo (Just x) = show x foo Nothing = "Nothing" 然后我尝试使用这个功能
我的以下代码会出现此错误,该代码应创建一个由2个数组组成的数组,每个数组包含100个随机点: type Point = (Float, Float) initBg :: Int -> [[Point]
我正在配置 xmonad,由于我必须启动几个 dzen 实例,因此我决定最好使用一个接受 x 和 y 位置、宽度、高度和文本对齐参数的函数: -- mydzen.hs import Data.List
我对 Haskell 还很陌生,我不明白为什么我不能比较这两个变量。我有这个功能: nextMinute :: Date -> Time -> DateTime nextMinute date tim
我有一些 python 代码,我尝试在其中使用第三方模块 (tweepy): ... import tweepy auth = tweepy.OAuthHandler(consumer_key, co
我正在尝试使用联合操作将 Haskell 整数集定义为 Monoid . module MyMonoid where import qualified Data.IntSet as S data My
我为我的网络应用程序使用托管(Struts + hibernate), 托管 java 内存限制:-XX:MaxPermSize=320m。 我的 web 应用程序的每个用户都可以检索(仅从数据库读取
我试图在 Android 上做一些简单的事情。我创建了一个登录页面并继续工作。当我尝试创建弹出窗口时,抛出了致命异常。帮帮忙 NewProjectActivity.java public class
写这个的时候出现错误: definition x = x definition :: Int -> Int 最佳答案 您正在 GHCi 中逐行输入您的代码。 第一行定义了你的函数。 第二行要求打印,打
在 ghci 我可以这样做: ghci> (fmap . const) 5 [1,2,3,4,5] [5,5,5,5,5] 但如果我尝试提取子表达式 (fmap . const)进入一个变量我得到一个
我需要从麦克风录制音频并将其转换为文本。我已经使用从网上下载的几个音频剪辑尝试了这个转换过程,它工作正常。但是,当我尝试转换从麦克风录制的音频剪辑时,会出现以下错误。 回溯(最近一次通话最后): 文件
Effective Modern C++ Item 25(170p~171p)中的代码如下: class Widget { public: void setName(const std::string
我是一名优秀的程序员,十分优秀!