- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我创建了一个程序来分析插入输入的 file.wav。我想知道是否可以从原始 file.wav 中删除时间间隔。我会在一定时间内剪掉分析中不必要的声音部分。消除这些声音部分后,我会得到一个新的连续声音,将所有未消除的声音融合在一起。这是可能的?你能帮我吗?
最佳答案
一旦您读入 WAV 格式文件、解析标题并将音频曲线数据点存放到某种数据结构中,您就有两种选择。
就地更新(实现起来比较棘手)
将好的数据点复制到新的数据结构中(让我们这样做)
WAV 格式的优点是它的 PCM,这意味着音频曲线表示为该曲线上的离散点。确保您已确定 header 中可用的位深度。典型的位深度为 16 位,这意味着每个样本将消耗内存缓冲区中两个字节的数据。打印出 100 个左右的样本值,以确认您手头有格式正确的样本。如果是 16 位,则可能值的范围将映射到 2^16 个不同的整数值。当您检查这些示例值时,是否已签名很重要。
作为垫脚石,我首先会编写一些代码,这些代码只需读入 WAV 文件并将每个字节复制到输出文件中。确认您可以播放这个新的输出 WAV 文件。接下来编写类似的代码,只不过这次解析 header ,识别采样率字段,将其值从 44100 更新到 22050,输出包含此更新的 header ,然后输出出现在 WAV 文件中 header 后面的音频数据字节。播放此 WAV 文件,它是否加快或减慢了音轨?
当您打开输入 WAV 文件并读取标题字节之后的每个字节时,就可以将两个字节组合成单个 16 位整数变量(如果您的标题说您有 16 位样本)。每个音频样本将消耗多个字节(8 位音频听起来很可怕)。因此,如果您有 24 位音频,那么给定 channel 中的每个音频样本当然将跨越文件的三个字节。请注意大字节序和小字节序的概念(您的两个字节是从左到右还是从右到左显示)。为简单起见,首先使用单声道输入 WAV 文件。立体声(2 channel )或 X channel 可以采用 WAV 格式,但单声道更容易。
假设我们有 10 个样本(每个样本都是 16 位整数)
因此输出文件将仅包含忽略坏样本 4 - 7 后剩下的内容,因此它将只有 6 个样本。
循环所有样本 -> 识别当前样本是否良好 -> 仅将良好样本复制到输出数据结构中
int out_index = 0;
int bit_depth = 16; // get this 16 from header, could be 24 for example
// how many bytes in bit depth, 2 if 16 bit, 3 if 24 bit
int incr_index = bit_depth / 8;
for (int in_index = 0; in_index < size; in_index += incr_index) {
if (is_sample_good(in_index)) { // is this sample good or bad
output_data[out_index] = input_data[in_index];
output_data[out_index + 1] = input_data[in_index + 1];
out_index += incr_index;
}
}
请注意,在此代码中,输入和输出数据结构都有自己的索引......这很重要,因为我们只在好的样本上提高输出索引
WAV 格式文件头始终是 WAV 文件的前 X 个字节(如果我没记错的话,是 32 个字节)。此 header 中是总数据大小的指示符。跟踪良好样本的数量,这些样本将驱动此数据长度 header 标签的值,您将把该数据长度 header 标签放入输出 WAV 文件的 header 部分。迭代输入文件并生成输出数据结构(内存缓冲区)后,打开新的输出文件,将带有更新的长度标记值的新 header 写入该文件,然后写入新的内存缓冲区,关闭文件并播放。
这里是一些WAV格式的链接
http://unusedino.de/ec64/technical/formats/wav.html
https://www.gamedev.net/resources/_/technical/game-programming/loading-a-wave-file-r709
http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html
http://www.topherlee.com/software/pcm-tut-wavformat.html
http://www.labbookpages.co.uk/audio/javaWavFiles.html
http://www.drdobbs.com/database/inside-the-riff-specification/184409308
关于java - 如何删除声音片段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42470615/
是否可以在无需用户点击或鼠标悬停的情况下播放声音文件? 我有一个记分牌,我想在球队得分时播放声音文件。任何指示将不胜感激。我基本上完成了记分牌,但没有声音。 谢谢。 最佳答案 https://gith
我正在创建一个音频应用程序,其中有两个名为 录制音频 浏览音频 当用户单击第一个按钮时,他可以录制音频。这已经实现。 当用户单击第二个按钮时,他可以浏览以查找iPhone库中已经存在的音频/声音。我对
香港专业教育学院一直在使用SoX来将文件修剪为恰好2秒长,但是我注意到音频文件最后总是额外多了32毫秒左右,显然它的额外数据是要告知其他解码器其信息,但是否必须添加放在文件的长度上? 我创建了一个程序
我将使用代码来获取设备的默认音量/声音,该默认音量/声音是使用设备上的音量调高或调低按钮设置的,下面是我要访问声音的代码, 为了解决此错误,我已经进行了研究,发现要访问此代码,我们需要使用CoreAu
我有解码 MP3 并用所有“值”填充数组的代码。 我的问题是:这些值(value)观是什么?它们是频率吗?它们是振幅吗? 这是代码: File file = new File(song.getFile
哈乌乌,我正在尝试实现 Pong。 现在我想播放声音,但它抛出异常(UnsupportedAudioFileException)。我做错了什么? AudioInputStream ainBalk;
我在大学的一个兄弟会中,在这个兄弟会中我们有楼梯。时不时有人从那些楼梯上掉下来。我们通常从吧台后面的电脑播放音乐(通常来自互联网或 iTunes)。我有一个 usb 按钮,想编写一个程序,当有人从楼梯
我想检测来自用户语音的声音/噪音,如果语音输入为空,它会自动停止。 为应用程序点赞 talking tom cat当有声音/语音输入时它会自动开始收听,当没有声音/语音输入时会自动停止。 任何帮助都将
我正在使用 jQuery Sound Plugin在我的网站上创建一些声音效果,但我无法播放。我收到此消息: settings.events.error(null, {msg: "You have n
我有一段代码可以在我点击一个按钮后播放声音。当我第二次单击此按钮时,首先会出现重置之类的东西。 我想要的是:每次单击按钮时我都想立即播放声音而无需重置按钮。 我的代码: -(IBAction)play
我在android studio中制作了一个闹钟。我可以运行该应用程序,除了播放闹钟铃声外,其他一切正常。实际上,当闹钟时间到来时,没有声音播放。我不知道我的代码有什么问题。请帮我找出错误。 主要 A
有什么方法可以在关闭声音的情况下播放 UILocalNotification 声音。实际上,我正在尝试创建一个闹钟,即使用户关闭了声音也能正常工作。或实现此目的的任何替代方法。 最佳答案 如果用户关闭
我试图从字符串创建音频,我试图举一个例子,用户输入他们的名字,然后将其转换为声音/音频 - 声音/音频会根据输入的字符串而有所不同。 (我不想在字符串上执行“文本到语音”,只是创建由字符串生成的声音,
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
对大量二进制文件(例如音频和视频文件)进行版本控制的最佳方法是什么? Git 似乎并不是真正为处理大量二进制文件而设计的。 另一个问题是内容制作者不一定想学习如何使用像 Git 这样的开发人员工具。
我想让一个 python 程序在它完成任务时发出哔声来提醒我。目前,我使用 import os 然后使用命令行语音程序说“处理完成”。我宁愿它是一个简单的“铃铛”。 我知道 Cocoa 应用程序中可以
请原谅这个愚蠢的新手问题,但是:当我(不小心)在命令行窗口中按退格键时,如何关闭 MATLAB 发出的极其烦人的“哔”声? 最佳答案 只是beep off在最新版本中。 https://www.mat
如何找出用户在控制面板中配置了哪些声音文件? 示例:我想播放“设备已连接”的声音。 哪个API可用于查询控制面板声音设置? 我看到控制面板对话框中有一些由第三方程序创建的自定义条目,因此必须有一种方法
我对实现与此人 link 类似的处理方式感兴趣。 据我了解,她将一段视频切成 tiff 格式,然后使用 RiTa 库进行合成 有谁知道如何实现这样的事情,只是改变我正在使用其他扩展名或文件格式的事实。
使用 C#,我试图捕获 PC 正在播放的音频,而不使用 WASAPI 和环回,因为我的声卡似乎不支持它。 TeamViewer 之类的程序是如何做到的?当我使用它时,人们可以从我的 PC 听到音频。
我是一名优秀的程序员,十分优秀!