gpt4 book ai didi

parsing - Attoparsec:跳过(但不包括)多字符分隔符

转载 作者:行者123 更新时间:2023-12-02 20:58:25 24 4
gpt4 key购买 nike

我有一个几乎可以包含任何字符的字符串。字符串内部有分隔符{{{

例如:afskjdfakjsdfkjas{{{fasdf

使用 attoparsec,编写跳过 {{{ 之前的所有字符,但不消耗 {{{ 的 Parser () 的惯用方法是什么?

最佳答案

使用attoparseclookAhead(它应用解析器而不消耗任何输入)和manyTill来编写一个解析器,它消耗最多的所有内容(但不包括){{{ 分隔符。然后,您可以自由地应用该解析器并丢弃其结果。

{-# LANGUAGE OverloadedStrings #-}

import Control.Applicative ( (<|>) )
import Data.Text ( Text )
import qualified Data.Text as T
import Data.Attoparsec.Text
import Data.Attoparsec.Combinator ( lookAhead, manyTill )

myParser :: Parser Text
myParser = T.concat <$> manyTill (nonOpBraceSpan <|> opBraceSpan)
(lookAhead $ string "{{{")
<?> "{{{"
where
opBraceSpan = takeWhile1 (== '{')
nonOpBraceSpan = takeWhile1 (/= '{')

在 GHCi 中:

λ> :set -XOverloadedStrings 
λ> parseTest myParser "{foo{{bar{{{baz"
Done "{{{baz" "{foo{{bar"

关于parsing - Attoparsec:跳过(但不包括)多字符分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30446223/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com