haskell - 使用管道的顺序二进制数据解码-6ren

haskell - 使用管道的顺序二进制数据解码

转载作者：行者123 更新时间：2023-12-04 15:24:57

25

4

目标是拥有一个具有以下类型签名的管道

protobufConduit :: MonadResource m => (ByteString -> a) -> Conduit ByteString m a

管道应重复解析通过 TCP/IP(使用 ByteString -> a 包)接收的 Protocol Buffer (使用 network-conduit 函数)。
有线消息格式为

{length (32 bits big endian)}{protobuf 1}{length}{protobuf 2}...

(花括号不是协议(protocol)的一部分，仅在此处用于分隔实体)。
第一个想法是使用 sequenceSink重复申请 Sink能够解析一个 ProtoBuf:

[...]
import qualified Data.Binary         as B
import qualified Data.Conduit.Binary as CB
import qualified Data.Conduit.Util   as CU

protobufConduit :: MonadResource m => (ByteString -> a) -> Conduit ByteString m a
protobufConduit protobufDecode =
    CU.sequenceSink () $ \() ->
        do lenBytes <- CB.take 4                                -- read protobuf length
           let len :: Word32
               len = B.decode lengthBytes                       -- decode ProtoBuf length
               intLen = fromIntegral len
           protobufBytes <- CB.take intLen                      -- read the ProtoBuf bytes
           return $ CU.Emit () [ protobufDecode protobufBytes ] -- emit decoded ProtoBuf

它不起作用(仅适用于第一个 Protocol Buffer )，因为似乎有许多“剩余”字节已从源读取但未通过 CB.take 使用被丢弃。
而且我发现没有办法将“其余部分推回源头”。
我完全错误地理解了这个概念吗？
PS:即使我在这里使用 Protocol Buffer ，问题也与 Protocol Buffer 无关。为了调试问题，我总是使用 {length}{UTF8 encoded string}{length}{UTF8 encoded string}...以及与上述类似的管道( utf8StringConduit :: MonadResource m => Conduit ByteString m Text )。
更新:
我只是尝试用剩余的字节替换状态(上面示例中没有状态 ())并替换了 CB.take通过调用一个函数来调用，该函数首先消耗已经读取的字节(来自状态)并调用 await仅在需要时(当状态不够大时)。不幸的是，这也不起作用，因为一旦 Source 没有剩余字节， sequenceSink不执行代码，但状态仍然包含剩余的字节:-(。
如果您应该对代码感兴趣(没有优化或非常好，但应该足以测试):

utf8StringConduit :: forall m. MonadResource m => Conduit ByteString m Text
utf8StringConduit =
    CU.sequenceSink [] $ \st ->
        do (lengthBytes, st') <- takeWithState BS.empty st 4
           let len :: Word32
               len = B.decode $ BSL.fromChunks [lengthBytes]
               intLength = fromIntegral len
           (textBytes, st'') <- takeWithState BS.empty st' intLength
           return $ CU.Emit st'' [ TE.decodeUtf8 $ textBytes ]

takeWithState :: Monad m
              => ByteString
              -> [ByteString]
              -> Int
              -> Pipe l ByteString o u m (ByteString, [ByteString])
takeWithState acc state 0 = return (acc, state)
takeWithState acc state neededLen =
    let stateLenSum = foldl' (+) 0 $ map BS.length state
     in if stateLenSum >= neededLen
           then do let (firstChunk:state') = state
                       (neededChunk, pushBack) = BS.splitAt neededLen firstChunk
                       acc' = acc `BS.append` neededChunk
                       neededLen' = neededLen - BS.length neededChunk
                       state'' = if BS.null pushBack
                                    then state'
                                    else pushBack:state'
                   takeWithState acc' state'' neededLen'
           else do aM <- await
                   case aM of
                     Just a -> takeWithState acc (state ++ [a]) neededLen
                     Nothing -> error "to be fixed later"

最佳答案

对于 Protocol Buffer 解析和序列化，我们使用 messageWithLengthPutM和 messageWithLengthGetM (见下文)但我认为它对长度使用 varint 编码，这不是您所需要的。我可能会尝试通过替换 messageWithLength 来调整下面的实现。获取/放置类似的东西

myMessageWithLengthGetM = 
   do size <- getWord32be 
      getMessageWithSize size

但我不知道如何实现 getMessageWithSize使用 Protocol Buffer 包中的可用功能。另一方面，您可以 getByteString然后“重新解析”字节串。

关于管道:您是否尝试过在没有 Data.Conduit.Util 的情况下实现管道？ ?就像是

protobufConduit protobufDecode = loop
   where
      loop = 
         do len <- liftM convertLen (CB.take 4)
            bs <- CB.take len
            yield (protobufDecode bs)
            loop

这是我们使用的代码:

pbufSerialize :: (ReflectDescriptor w, Wire w) => Conduit w IO ByteString
pbufSerialize = awaitForever f
    where f pb = M.mapM_ yield $ BSL.toChunks $ runPut (messageWithLengthPutM pb)

pbufParse :: (ReflectDescriptor w, Wire w, Show w) => Conduit ByteString IO w
pbufParse = new
    where
      new = read (runGet messageWithLengthGetM . BSL.fromChunks . (:[]))
      read parse =
          do mbs <- await
             case mbs of
               Just bs -> checkResult (parse bs)
               Nothing -> return ()
      checkResult result =
          case result of
            Failed _ errmsg -> fail errmsg
            Partial cont -> read (cont . Just . BSL.fromChunks . (:[]))
            Finished rest _ msg ->
                do yield msg
                   checkResult (runGet messageWithLengthGetM rest)

关于haskell - 使用管道的顺序二进制数据解码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12568900/

25

4

0

文章推荐： asp.net - 您可以以编程方式设置 MachineKey 吗？

文章推荐： ember.js - 分配给 Ember Data 中的 hasMany 关系

文章推荐： bdd - 我们如何处理 BDD 场景的细微排列？

变异操作的 GraphQL 顺序
我正在创建一个有效的突变，但我不确定它是否按照我认为的方式工作。但是，我想知道执行顺序是什么？异步从上到下同步同步随机顺序其他我想确保在执行插入/更新插入之前从表中删除某些项目。使用以下突变
isabelle - field 顺序
如何更改规则中的前提顺序？例如，在伊莎贝尔的自然演绎规则中: mp: ?P ⟶ ?Q ⟹ ?P ⟹ ?Q 我们可以将顺序更改为: ?P ⟹ ?P ⟶ ?Q ⟹ ?Q 我可以用 rev_mp或者定义一
java - LinkedHashMap 顺序
关闭。这个问题需要details or clarity .它目前不接受答案。想改善这个问题吗？通过 editing this post 添加详细信息并澄清问题. 8年前关闭。 Improve thi
按关联的 hibernate 顺序
我正在使用 Hibernate 3.2，并使用标准来构建查询。我想为多对一关联添加和“排序”，但我不知道如何做到这一点。 Hibernate 查询最终看起来像这样，我猜: select t1.a, t
Javascript:顺序，而不是并行
我正在开发一个项目，但无法让我的 javascript 按顺序工作。我知道 javascript 可以并行执行任务，因此当您向不响应的服务器发出请求时，它不会被卡住。这有它的优点和缺点。就我而言，这是
dart - future 顺序
在下面的代码中，我认为f1 > f2 > f3是调用顺序，但是仅f1被调用。如何获得依次调用的3个函数？我已经将以下内容添加到main函数中，它可以按预期工作，但是我想知道是否还有其他确定的方法可以
javascript - 在对象数组中添加位置/顺序
我有一个如下所示的对象数组: [{ "id": 1, "Size": 90, "Maturity": 24, }, { "id": 2, "S
docker - Docker多阶段构建:顺序
这是征求意见和要求的请求。我是Docker的新手。我想要一个用于Python项目的生产和开发容器(可能也进行单元测试)。我的搜索指向多阶段Dockerfile(以及运行它们的多个docker-com
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
Cordova Hook 顺序
在 Cordova 网站上，您可以看到一长串按字母顺序排列的钩子(Hook)列表，但它们触发和执行的正确顺序是什么？我正在尝试在构建/编译之前将 cordova.js 脚本添加到 index.htm
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
JAVA HashSet 顺序
这个问题已经有答案了: 奥 git _a (2 个回答) 已关闭 9 年前。这是我的一个练习的代码， public class RockTest { public static void main(
java - java中哪些数据结构支持排序/顺序
我使用 HashMap 来存储一些数据，但每当新数据保存到 HashMap 或旧数据移出 HashMap 时，我都需要将其保持升序。但是hashmap本身不支持顺序，我可以使用什么数据结构来支持顺序？
f# - 顺序 - 随后几年的同一日期
我想创建一个序列，当星期几与函数参数中的日期相同时，它会返回所有年份的结果(例如:自开始日期起，2 月 12 日为星期日的所有年份)。 let myDate (dw:System.DayOfWeek)
C# LINQ 顺序
我有一个包含许多元素的 Xelement。我有以下代码来对它们进行排序: var calculation = from y in x.Elements("row")
Javascript Action 顺序
假设我有: 在 javacript 文件中，我为类按钮和 ID 名称定义了点击操作，例如: $("#name").click(function(event){ alert("hi"); }) $
Swift LayoutSubViews 顺序
我有一个包含 2 个 subview 的 View - collectionView 和自定义 View 。我想设置一个操作在布置 2 个 View 后运行，但layoutSubViews 运行了两次
Java 顺序 UUID
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 2年前关闭。 Improve this questi
c++ - 如何比较两个双向迭代器的(顺序)？
我想知道 C++ 中是否有内置方法来比较两个双向迭代器的顺序。例如，我有一个 Sum 函数来计算同一列表中 2 个迭代器之间的总和: double Sum(std::list::const_itera
MySQL ORDER BY 顺序
在 MySQL 中，这两个查询之间有区别吗？ SELECT * FROM .... ORDER BY Created,Id DESC 和 SELECT * FROM .... ORDER BY Cre

首页

博学

6Ren·AI

商城

haskell - 使用管道的顺序二进制数据解码