haskell - 嵌套的迭代器-6ren

haskell - 嵌套的迭代器

转载作者：行者123 更新时间：2023-12-01 02:43:15

25

4

我正在使用一个特定的数据库，如果成功
查询，您可以使用来访问一组结果数据
具体命令：

getResultData :: IO (ResponseCode, ByteString)

现在，getResultData将返回响应代码和一些数据，其中
响应代码如下所示：

response = GET_DATA_FAILED | OPERATION_SUCCEEDED | NO_MORE_DATA

ByteString是一个，一些或所有块：

Data http://desmond.imageshack.us/Himg189/scaled.php?server=189&filename=chunksjpeg.png&res=medium

故事还没有结束。存在一组群组：

Stream http://desmond.imageshack.us/Himg695/scaled.php?server=695&filename=chunkgroupsjpeg.png&res=medium

收到getResultData的NO_MORE_DATA响应后，将调用
getNextItem将迭代流，使我可以开始调用
再次获取结果。一旦getNextItem返回STREAM_FINISHED，即
她写的所有;我有我的数据。

现在，我希望使用Date.Iteratee或Data.Enumerator来重塑此现象。因为我的
现有的Data.Iteratee解决方案有效，但似乎还很幼稚，我觉得我应该对此建模
嵌套的迭代器，而不是一个大的迭代器blob，这就是
我的解决方案目前已实施。

我一直在看Data.Iteratee 0.8.6.2的代码，我有点困惑
当涉及到嵌套的东西时。

嵌套迭代是否正确？如果是这样，将如何使用嵌套的迭代器对此建模？

问候

最佳答案

我认为嵌套的迭代器是正确的方法，但是这种情况有一些独特的问题，使其与大多数常见示例略有不同。

块和组

第一个问题是正确获取数据源。基本上，您所描述的逻辑划分将为您提供与[[ByteString]]等效的流。如果创建一个枚举器来直接产生该枚举器，则流中的每个元素将是一整组块，大概是出于内存原因，您希望避免这种情况。您可以将所有内容拼合为一个[ByteString]，但是随后您需要重新引入边界，这将非常浪费，因为数据库正在为您执行此操作。

现在忽略组的流，您似乎需要自己将数据分成多个块。我将其建模为：

enumGroup :: Enumerator ByteString IO a
enumGroup = enumFromCallback cb ()
 where
  cb () = do
    (code, data) <- getResultData
    case code of
        OPERATION_SUCCEEDED -> return $ Right ((True, ()), data)
        NO_MORE_DATA        -> return $ Right ((False, ()), data)
        GET_DATA_FAILED     -> return $ Left MyException

由于块大小是固定的，因此您可以使用 Data.Iteratee.group轻松地对其进行块化。

enumGroupChunked :: Iteratee [ByteString] IO a -> IO (Iteratee ByteString IO a)
enumGroupChunked = enumGroup . joinI . group groupSize

比较此类型与 Enumerator

type Enumerator s m a = Iteratee s m a -> m (Iteratee s m a)

因此， enumGroupChunked基本上是更改流类型的奇特枚举器。这意味着它需要一个[ByteString] iteratee使用者，并返回一个使用普通字节串的iteratee。通常，枚举数的返回类型无关紧要；它只是一个迭代器，您可以使用 run（或 tryRun）进行评估以获取输出，因此您可以在此处执行相同的操作：

evalGroupChunked :: Iteratee [ByteString] IO a -> IO a
evalGroupChunked i = enumGroupChunked i >>= run

如果您要对每个组执行更复杂的处理，则最简单的方法是在 enumGroupChunked函数中。

组流

现在，这已经不成问题了，如何处理小组流？答案取决于您要如何消费它们。如果您想本质上独立对待流中的每个组，我将执行以下操作：

foldStream :: Iteratee [ByteString] IO a -> (b -> a -> b) -> b -> IO b
foldStream iter f acc0 = do
  val <- evalGroupChunked iter
  res <- getNextItem
  case res of 
        OPERATION_SUCCEEDED -> foldStream iter f $! f acc0 val
        NO_MORE_DATA        -> return $ f acc0 val
        GET_DATA_FAILED     -> error "had a problem"

但是，假设您要对整个数据集进行某种流处理，而不仅仅是单个组。也就是说，你有一个

bigProc :: Iteratee [ByteString] IO a

您想在整个数据集上运行。这是枚举器的返回迭代器有用的地方。现在，一些先前的代码会稍有不同：

enumGroupChunked' :: Iteratee [ByteString] IO a
  -> IO (Iteratee ByteString IO (Iteratee [ByteString] IO a))
enumGroupChunked' = enumGroup . group groupSize

procStream :: Iteratee [ByteString] IO a -> a
procStream iter = do
  i' <- enumGroupChunked' iter >>= run
  res <- getNextItem
  case res of 
        OPERATION_SUCCEEDED -> procStream i'
        NO_MORE_DATA        -> run i'
        GET_DATA_FAILED     -> error "had a problem"

嵌套迭代器（即 Iteratee s1 m (Iteratee s2 m a)）的这种用法很少见，但是当您要顺序处理来自多个枚举器的数据时，它特别有用。关键是要认识到，对外部iteratee进行抄送将为您提供准备接收更多数据的iteratee。在这种情况下，此模型非常有效，因为您可以独立枚举每个组，但可以将它们作为单个流进行处理。

一个警告：内部迭代器将处于它所处于的任何状态。假设一个组的最后一个块可能小于完整的块，例如

   Group A               Group B               Group C
   1024, 1024, 512       1024, 1024, 1024      1024, 1024, 1024

在这种情况下将发生的事情是，由于 run将数据合并为大小为1024的块，因此它将把组A的最后一块与组B的前512个字节合并。这对于示例，因为该代码终止了内部迭代器（带有 group）。这意味着这些组是真正独立的，因此您必须这样对待它们。如果要像 foldStream中那样组合组，则必须考虑整个流。如果是这种情况，那么您将需要使用比 joinI更复杂的工具。

Data.Iteratee与Data.Enumerator

在不讨论任何一个软件包的优劣的情况下，更不用说 IterIO（我很偏颇），我想指出我认为两者之间最重要的区别：流的抽象。

在Data.Iteratee中，使用者 procStream在某种长度的名义ByteString上进行操作，一次可以访问单个 group块。

在Data.Enumerator中，使用者 Iteratee ByteString m a对概念[ByteString]进行操作，一次可访问一个或多个元素（字节字符串）。

这意味着大多数Data.Iteratee操作都以元素为中心，即使用 ByteString时，它们将在单个 Iteratee ByteString m a上进行操作，而Data.Enumerator操作是针对块的，在 Iteratee ByteString上进行操作。

您可以想到 Word8 === ByteString。

关于haskell - 嵌套的迭代器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7560944/

25

4

0

文章推荐： javascript - 需要在抽屉按钮上绑定(bind)onclick事件

文章推荐： javascript - 清除间隔的小问题

文章推荐： python - 将实时数据合并到二维数组中

haskell - Haskell 和类 Haskell 语言之间的类型声明语法差异
在 Haskell 中，类型声明使用双冒号，即 (::)，如 not::Bool -> Bool。但是在许多语法与 Haskell 类似的语言中，例如榆树、 Agda 、他们使用单个冒号(:)来声明
haskell - 在模板 haskell 中运行模板 haskell
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
haskell - 在 Haskell ("second order Haskell"中生成 Haskell 类型的工具？
如果这个问题有点含糊，请提前道歉。这是一些周末白日梦的结果。借助 Haskell 出色的类型系统，将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是，看看 numeric-prelud
haskell - 如何仅使用 Haskell 无休止地运行 Haskell 程序？
我有需要每 5 分钟执行一次的小程序。目前，我有执行该任务的 shell 脚本，但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。实现这一目标的最佳方法是什么？最佳答案我想你会
haskell - 需要以真实世界 Haskell 风格解决哪些 Haskell 主题？
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后，我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中，作为一个 haskell 学生，读起来多么
haskell - 用 Haskell 编写 Haskell 解释器
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗？我想使用 Haskell
haskell - Haskell 中的仿函数定义及其在 Learn You a Haskell 中的解释令人困惑
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。这是什么意思？即“值的类型”是什么意思？ Int 是“值的类型”，对吗？但是 Maybe 不是“值的类型”
haskell - haskell 中有包含字符串和列表的类型吗？
现在我正在尝试创建一个基本函数，用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
haskell - 案例中的模式匹配，Haskell
我是 Haskell 的新手，对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
haskell - Haskell 中的这个仿函数是什么意思？
如何解释这个表达式？ :t (+) (+3) (*100) 自和具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是，我不知道它的作用。在 Learn
haskell - Haskell 如何计算表达式
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section，它仍然将 * 视为
haskell - 删除满足谓词的第一个元素(Haskell)
我想创建一个函数，删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
haskell - Haskell 中的内存
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
haskell - 惰性评估和严格评估 Haskell
我明白惰性求值是什么，它是如何工作的以及它有什么优势，但是你能解释一下 Haskell 中什么是严格求值吗？我似乎找不到太多关于它的信息，因为惰性评估是最著名的。他们各自的优势是什么。什么时候真正使
haskell - Haskell 中的反向函数行为
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
haskell - Haskell 是否支持类型类的匿名实例？
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
haskell - 使用需要多个输入的过滤器 - Haskell
我对 Haskell 比较陌生，过去几周一直在尝试学习它，但一直停留在过滤器和谓词上，我希望能得到帮助以帮助理解。我遇到了一个问题，我有一个元组列表。每个元组包含一个 (songName, song
haskell - 或采用两个值参数 haskell
我是 haskell 的初学者，我试图为埃拉托色尼筛法定义一个简单的函数，但它说错误: • Couldn't match expected type ‘Bool -> Bool’
haskell - Haskell 中的读取函数
我是 Haskell 语言的新手，我在使用 read 函数时遇到了一些问题。准确地说，我的理解是: read "8.2" + 3.8 应该返回 12.0，因为我们希望返回与第二个成员相同的类型。我真正
haskell - Haskell 声明中的感叹号是什么意思？
当我尝试使用真实项目来驱动它来学习 Haskell 时，我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思，我的书上好像也没有提到。 data MidiMessage = MidiMessage

首页

博学

6Ren·AI

商城

haskell - 嵌套的迭代器