- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章30行Python代码打造一款简单的人工语音对话由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
@Author:Runsen 。
1876年,亚历山大・格雷厄姆・贝尔(Alexander Graham Bell)发明了一种电报机,可以通过电线传输音频。托马斯・爱迪生(Thomas Edison)于1877年发明了留声机,这是第一台记录声音并播放声音的机器.
最早的语音识别软件之一是由Bells Labs在1952年编写的,只能识别数字。1985年,IBM发布了使用“隐马尔可夫模型”的软件,该软件可识别1000多个单词.
几年前,一个replace("?","")代码价值一个亿 。
如今,在Python中Tensorflow,Keras,Librosa,Kaldi和语音转文本API等多种工具使语音计算变得更加容易.
今天,我使用gtts和speech_recognition,教大家如何通过三十行代码,打造一款简单的人工语音对话。思路就是将语音变成文本,然后文本变成语音.
gtts是将文字转化为语音,但是需要在VPN下使用。这个因为要接谷歌服务器.
具体gtts的官方文档:
下面,让我们看一段简单的的代码 。
from gtts import gTTSdef speak(audioString): print(audioString) tts = gTTS(text=audioString, lang="en") tts.save("audio.mp3") os.system("audio.mp3") speak("Hi Runsen, what can I do for you?")
执行上面的代码,就可以生成一个mp3文件,播放就可以听到了Hi Runsen, what can I do for you?。这个MP3会自动弹出来的.
speech_recognition用于执行语音识别的库,支持在线和离线的多个引擎和API.
speech_recognition具体官方文档 。
安装speech_recognition可以会出现错误,对此解决的方法是通过该网址安装对应的whl包 。
在官方文档中提供了具体的识别来自麦克风的语音输入的代码 。
下面就是 speech_recognition 用麦克风记录下你的话,这里我使用的是 recognize_google,speech_recognition 提供了很多的类似的接口.
import timeimport speech_recognition as sr# 录下来你讲的话def recordAudio(): # 用麦克风记录下你的话 print("开始麦克风记录下你的话") r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) data = "" try: data = r.recognize_google(audio) print("You said: " + data) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e)) return dataif __name__ == "__main__": time.sleep(2) while True: data = recordAudio() print(data)
下面是我乱说的英语 。
上面,我们实现了用麦克风记录下你的话,并且得到了对应的文本,那么下一步就是字符串的文本操作了,比如说how are you,那回答"I am fine”,然后将"I am fine”通过gtts是将文字转化为语音 。
# @Author:Runsen# -*- coding: UTF-8 -*-import speech_recognition as srfrom time import ctimeimport timeimport osfrom gtts import gTTS# 讲出来AI的话def speak(audioString): print(audioString) tts = gTTS(text=audioString, lang="en") tts.save("audio.mp3") os.system("audio.mp3")# 录下来你讲的话def recordAudio(): # 用麦克风记录下你的话 r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) data = "" try: data = r.recognize_google(audio) print("You said: " + data) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e)) return data# 自带的对话技能(逻辑代码:rules)def jarvis(): while True: data = recordAudio() print(data) if "how are you" in data: speak("I am fine") if "time" in data: speak(ctime()) if "where is" in data: data = data.split(" ") location = data[2] speak("Hold on Runsen, I will show you where " + location + " is.") # 打开谷歌地址 os.system("open -a Safari https://www.google.com/maps/place/" + location + "/&") if "bye" in data: speak("bye bye") breakif __name__ == "__main__": # 初始化 time.sleep(2) speak("Hi Runsen, what can I do for you?") # 跑起 jarvis()
当我说how are you?会弹出I am fine的mp3 。
当我说where is Chiana?会弹出Hold on Runsen, I will show you where China is.的MP3 。
同样也会弹出China的谷歌地图 。
本项目对应的Github 。
以上就是30行Python代码打造一款简单的人工语音对话的详细内容,更多关于Python人工语音对话的资料请关注我其它相关文章! 。
原文链接:https://blog.csdn.net/weixin_44510615/article/details/117037126 。
最后此篇关于30行Python代码打造一款简单的人工语音对话的文章就讲到这里了,如果你想了解更多关于30行Python代码打造一款简单的人工语音对话的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我能想到的最好的标题,但要澄清的是,情况是这样的: 我正在开发一种类似短 url 的服务,该服务允许用户使用他们的 Twitter 帐户“登录”并发布内容。现在这项服务可以包含在 Tweetdeck
我正在开发一个应用程序,我需要用户使用类似聊天的系统相互交互。 为此,我想创建一个对话模型。据我所知,我将使用多对多关系。 具有以下模型:Conversation、User 和 Message,我想象
我试图在一个页面上多次实现 jquery 对话框 - 基本上,我想在用户单击某个人的名字时显示有关该人的更多信息。 我正在使用 php 生成页面。 我尝试这样做,并使其部分工作,但我只能使页面上的第一
我制作了一个 CustomTypeDialog 类,我想要的是使用不在 Activity 布局中的 EditText。当我尝试单击其中一个按钮时出现空指针异常,我认为这是因为它们不在 Activity
我有这个程序,我想知道如何继续它。我想让用户在“发生了什么”之后输入更多文本,然后让程序响应。感谢您的帮助 int main() { cout > answer; switch(an
我目前正在开发一个由 javafx ui 支持的 java 游戏。 玩家。应该可以和npc对话,这没问题。但我想要一定的文字效果。就像在 polemon 游戏或 Undertale 中一样,文本会逐个
所以基本上我正在尝试重写一个 bash 脚本,该脚本使用对话框 --radiolist 来选择区域设置、键盘、时间。目前,标签是与本地对应的数字(我为它创建了一个哈希表)。但因为我有大约 100 个语
随着社交媒体平台的快速发展,用户对内容分享的需求不断增加,社交分享按钮在数字营销和搜索引擎优化(SEO)策略中也成为提升网站流量和内容曝光率的重要工具。此外,图片、视频和文件的传输在协同工作和朋友共享
有人可以告诉我如何使用 Watson Conversation 和其他服务(例如 Twilio)调用实时电话并进行对话吗? 我可以使用 Watson Conversation、Twilio 和 Nod
我有一个包含几个 .txt 文件的目录。让我们说 hi.txt hello.txt hello_test.txt test.txt 在 VBA 中使用文件对话框,如何过滤以在下拉列表中仅显示“*tes
我有一个 session 范围的 bean,ComponenteM,它被注入(inject)到请求范围的 bean,ComponenteC 中。 @Named @RequestScoped publi
我需要收集推文“集”,即用于我的研究的推特对话; 这些集合还需要满足以下条件 其中的推文数量,以及 参与人数。 我研究过 Twitter Streaming API、twitter-stream ge
我想在用户 Lync 客户端中打开一个新对话,其中包含预先确定的消息文本,但消息的收件人由用户选择,此过程从用户单击网站。 这可能吗? 最佳答案 这里的部分问题是,如果不知道要与谁开始对话(如果有意义
在 JBoss AS7 中工作,使用 Conversation Scope 管理浏览器选项卡中的用户交互。 我注意到我的页面附加了 ?cid 参数。这很棒 - 直到用户为页面添加书签然后尝试返回它!对
本地和远程标记以及Call-ID的组合用于识别对话。据说Call-ID是一次调用的唯一值。那么为什么 Call-ID 不单独用于识别对话呢? 最佳答案 一句话:“发夹”。 “Hairpinning”是
除了这行不通之外,这里没什么好说的,我不知道为什么。 Arduino 上的串行输出什么也没有。 C# 代码的输出变为等待响应,然后什么也没有。 当我启动 C# 程序时,Arduino 上的蓝牙卡 LE
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
目前正在开发一个应用程序,它甚至可以与 Android 2.2 一起使用,我使用支持库及其 AppCompat 主题来设计我的 UI。尽管大部分 UI 工作正常,但我有一个带有自定义布局的 Alert
我正在尝试对 MySQL 表 I 进行类似对话的输出,如下所示: Content From To Date Lorem
我已经创建了消息系统,在 messages.php 上我想显示消息对话,应该显示最后一条消息,但不知道查询,因为我是 php 新手,这里是数据库信息 table:conversation_chat
我是一名优秀的程序员,十分优秀!