- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在“音频分析”领域是否有先前的开源工作来检测人声(比如尽管有一些背景噪音),确定说话者的性别,可能确定没有。演讲者的数量、演讲者的年龄以及演讲者的情绪?
我的预感是,像 CMU Sphinx 这样的语音识别软件可能是一个不错的起点,但如果有更好的东西,那就太好了。
最佳答案
我是一名从事语音识别研究的研究生。这些都是开放的研究问题,不幸的是,我不知道可以开箱即用的开源软件包。
如果您在实现信号处理或机器学习算法方面有一定的背景,您可以尝试使用以下一些搜索词查找学术论文:
sox
的东西确定话语的频谱(使用称为快速傅立叶变换的东西),并根据一些汇总统计数据(如平均频率)将语音分类为“男性”或“女性”(参见
http://classicalconvert.com/tag/sox/)。为了使这项工作稳健地工作(即使用许多扬声器、麦克风或录音环境),您可以做很多事情。我不确定我是否可以预测要获得 70% 的准确率需要多少时间和精力,因为这取决于您的任务的性质;我的感觉是 90%+ 肯定会很难。
关于speech-recognition - 音频分析以检测人声、性别、年龄和情绪——之前做过任何开源工作吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5062032/
我目前正在做一个项目,我必须提取用户的面部表情(网络摄像头一次只能提取一个用户),比如悲伤或快乐。 目前我发现的最佳可能性: 我使用 OpenCV 进行人脸检测。 OpenCV 开发板上的一些用户建议
此代码来自Facebook Chat Emoticons Bar Grease Monkey UserScript ImagesURL = HttpsOn?'https://s-static.ak.f
我正在寻找一种可以分析短文本情感的工具。我搜索了一个星期,但找不到一个可以公开获得的好的。理想的工具是将短文本作为输入并猜测情感的工具。它最好是一个独立的应用程序或库。 我不需要通过文本训练的工具。而
是否有任何简单的 Android/Java 库/框架可以检测图片上的人脸并给我一些关于图片上的人的信息?我的意思是诸如性别、年龄、情绪(微笑、悲伤、愤怒)之类的信息...... 我试过Face++和微
我下载了WN-Affect .但是,我不确定如何使用它来检测句子的情绪。例如,如果我有一个字符串“我讨厌足球”。我希望能够检测情绪是否不好,情绪是否是恐惧。 WN-Affect 没有关于如何操作的教程
现在,Skype 将淘汰其桌面 API 以支持 Skype URI,我正在尝试弄清楚如何修改状态和情绪消息。我的应用程序是一个 chrome 扩展程序,使用它的人都知道它的作用。它是一个合法的用例。目
我有这个: import styled from 'react-emotion'; const Box = styled('div')` display: flex; flex-directi
我是一名优秀的程序员,十分优秀!