haskell - 加快阅读 .wav 并在 Haskell 中进行分析？-6ren

haskell - 加快阅读 .wav 并在 Haskell 中进行分析？

转载作者：行者123 更新时间：2023-12-02 22:21:10

25

4

我正在尝试读取 .wav 文件，并且最终可能会使用数据，但我被卡住了。只是读入文件，将其存储在结构中，然后将其写入另一个文件需要很长时间。任何增加的处理都需要更长的时间。

我已经发布了我的代码，该代码相当简单。我一定遗漏了一些东西，使程序比必要的更复杂或多余。

import qualified Data.Char as DC
import qualified Data.Word as DW
import qualified Data.Int as DI

import qualified Data.Binary.Get as BG
import qualified Data.ByteString.Lazy as BL
import qualified Data.ByteString.Lazy.Internal as BLI

import qualified System.Environment as SE
import qualified System.IO as SIO

main = do
    (fstfilename:sndfilename:_) <- SE.getArgs
    fstfile <- SIO.openFile fstfilename SIO.ReadMode
    input <- BL.hGetContents fstfile

    raw_wav <- return $ BG.runGet parseWav input

    sndfile <- SIO.openFile sndfilename SIO.WriteMode
    SIO.hPutStr sndfile (show (wavData raw_wav))

data Sample = OneChannel {mono :: Integer} |
              TwoChannel {leftChannel :: Integer,
                         rightChannel :: Integer}

instance Show Sample where
    show (OneChannel m) = show m ++ " " 
    show (TwoChannel l r) = show l ++ "-" ++ show r ++ " "

data RaWavFile = RaWavFile {numChannels :: Integer,
                        sampleRate :: Integer,
                        bitsPerSample :: Integer,
                        wavData :: [Sample]}
                        deriving (Show)

parseWav :: BG.Get RaWavFile
parseWav = do
        BG.skip 22
        num_channels <- BG.getWord16le 
        sample_rate <- BG.getWord32le
        BG.skip 6
        bits_per_sample <- BG.getWord16le

        rem <- BG.getRemainingLazyByteString
        wav_data <- return $ BL.drop 8 (BL.dropWhile 
                            ((/=) (fromIntegral (DC.ord 'd') :: DW.Word8)) rem)

        nc <- return $ toInteger num_channels
        sr <- return $ toInteger sample_rate
        bps <- return $ toInteger bits_per_sample
        return $ RaWavFile nc sr bps (orgSamples nc bps wav_data)

--          numChannels bitpersample   wavData  
orgSamples :: Integer -> Integer -> BL.ByteString -> [Sample]
orgSamples nc bps BLI.Empty = [] 
orgSamples nc bps bs 
        | nc == 1 = (OneChannel (rle fb)):(orgSamples nc bps rst)
        | nc == 2 = (TwoChannel (rle fb) (rle sb)):(orgSamples nc bps rsst)
        | otherwise = error "Number of channels not 1 or 2"
            where nb = fromIntegral (bps `div` 8) :: DI.Int64
                  (fb, rst) = BL.splitAt nb bs
                  (sb, rsst) = BL.splitAt nb rst 
                  rle = toInteger . BG.runGet BG.getWord16le

最佳答案

为什么慢。

您正在使用 Integer用于存储单个样本。 Integer是一种用于存储任意精度整数的特殊类型。因此，每次读取/写入这些值都会产生大量开销。不惜一切代价避免。我建议使用特定大小的类型，例如 Int8/Int16 .您可能还应该对这些类型进行参数化。

您将样本存储为 channel 类型的标记联合。对于每个样本。这是很多开销。你真的期望 channel 数量会改变中间文件吗？可能不是。

您正在使用一个列表来存储您的样本，当您实质上是在谈论连续的字节流时，这会带来很多开销。

如何让它快速

在样本的位深度上参数化您的类型。我建议直接使用Int8/Int16因为 8 位和 16 位轨道是最常用的两种格式。您可能想坚持使用它们进行学习项目。

import Data.Int

使用Unboxed Vectors存储您的数据。这避免了(惰性)列表和 thunk 的大量开销，并将显着减少启动时的内存消耗。

import Data.Vector.Unboxed as V

不要存储轨道的数量。 length $ tracks $ wavFile将在您需要时随时取回。消除代码中对 Integer 的所有使用(除非您真的需要存储大于 2^64 的数字)

data RaWavFile b = RaWavFile {
    sampleRate :: Int,
    tracks     :: [Vector b] }
    deriving (Show)

使用类型来指导您。 binary在返回类型上是多态的。只需向它询问您想要的类型，它就会在没有您干预的情况下解析正确的字节数。

parseWav :: BL.ByteString -> BG.Get (RaWavFile b)
wav <- parseWav input :: BG.Get (RaWavFile Int16)

您应该只使用 BG.runGet一次，针对一个字节串运行你的解析器。

关于haskell - 加快阅读 .wav 并在 Haskell 中进行分析？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24319431/

25

4

0

文章推荐： Elasticsearch 每 10 分钟重启一次

文章推荐： elasticsearch - 在elasticsearch分面搜索中保留案例

文章推荐： elasticsearch - 性能基于 "terms"的长度

文章推荐： matlab - Matlab创建wav文件

haskell - Haskell 和类 Haskell 语言之间的类型声明语法差异
在 Haskell 中，类型声明使用双冒号，即 (::)，如 not::Bool -> Bool。但是在许多语法与 Haskell 类似的语言中，例如榆树、 Agda 、他们使用单个冒号(:)来声明
haskell - 在模板 haskell 中运行模板 haskell
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
haskell - 在 Haskell ("second order Haskell"中生成 Haskell 类型的工具？
如果这个问题有点含糊，请提前道歉。这是一些周末白日梦的结果。借助 Haskell 出色的类型系统，将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是，看看 numeric-prelud
haskell - 如何仅使用 Haskell 无休止地运行 Haskell 程序？
我有需要每 5 分钟执行一次的小程序。目前，我有执行该任务的 shell 脚本，但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。实现这一目标的最佳方法是什么？最佳答案我想你会
haskell - 需要以真实世界 Haskell 风格解决哪些 Haskell 主题？
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后，我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中，作为一个 haskell 学生，读起来多么
haskell - 用 Haskell 编写 Haskell 解释器
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗？我想使用 Haskell
haskell - Haskell 中的仿函数定义及其在 Learn You a Haskell 中的解释令人困惑
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。这是什么意思？即“值的类型”是什么意思？ Int 是“值的类型”，对吗？但是 Maybe 不是“值的类型”
haskell - haskell 中有包含字符串和列表的类型吗？
现在我正在尝试创建一个基本函数，用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
haskell - 案例中的模式匹配，Haskell
我是 Haskell 的新手，对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
haskell - Haskell 中的这个仿函数是什么意思？
如何解释这个表达式？ :t (+) (+3) (*100) 自和具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是，我不知道它的作用。在 Learn
haskell - Haskell 如何计算表达式
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section，它仍然将 * 视为
haskell - 删除满足谓词的第一个元素(Haskell)
我想创建一个函数，删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
haskell - Haskell 中的内存
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
haskell - 惰性评估和严格评估 Haskell
我明白惰性求值是什么，它是如何工作的以及它有什么优势，但是你能解释一下 Haskell 中什么是严格求值吗？我似乎找不到太多关于它的信息，因为惰性评估是最著名的。他们各自的优势是什么。什么时候真正使
haskell - Haskell 中的反向函数行为
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
haskell - Haskell 是否支持类型类的匿名实例？
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
haskell - 使用需要多个输入的过滤器 - Haskell
我对 Haskell 比较陌生，过去几周一直在尝试学习它，但一直停留在过滤器和谓词上，我希望能得到帮助以帮助理解。我遇到了一个问题，我有一个元组列表。每个元组包含一个 (songName, song
haskell - 或采用两个值参数 haskell
我是 haskell 的初学者，我试图为埃拉托色尼筛法定义一个简单的函数，但它说错误: • Couldn't match expected type ‘Bool -> Bool’
haskell - Haskell 中的读取函数
我是 Haskell 语言的新手，我在使用 read 函数时遇到了一些问题。准确地说，我的理解是: read "8.2" + 3.8 应该返回 12.0，因为我们希望返回与第二个成员相同的类型。我真正
haskell - Haskell 声明中的感叹号是什么意思？
当我尝试使用真实项目来驱动它来学习 Haskell 时，我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思，我的书上好像也没有提到。 data MidiMessage = MidiMessage

首页

博学

6Ren·AI

商城

haskell - 加快阅读 .wav 并在 Haskell 中进行分析？