- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑使用这些不同的解析器组合器。
import Control.Applicative.Combinators
import Text.Regex.Applicative
main :: IO ()
main = do
let parser1 = sym '"' *> manyTill anySym (sym '"')
print $ match parser1 "\"abc\""
let parser2 = sym '"' *> many anySym <* sym '"'
print $ match parser2 "\"abc\""
import Control.Applicative.Combinators
import Text.ParserCombinators.ReadP hiding(many, manyTill)
main :: IO ()
main = do
let parser1 = char '"' *> manyTill get (char '"')
print $ readP_to_S parser1 "\"abc\""
let parser2 = char '"' *> many get <* char '"'
print $ readP_to_S parser2 "\"abc\""
{-# LANGUAGE OverloadedStrings #-}
import Control.Applicative.Combinators
import Data.Attoparsec.Text hiding(manyTill)
main :: IO ()
main = do
let parser1 = char '"' *> manyTill anyChar (char '"')
print $ parseOnly parser1 "\"abc\""
let parser2 = char '"' *> many anyChar <* char '"'
print $ parseOnly parser2 "\"abc\""
import Control.Applicative.Combinators
import Text.Megaparsec hiding(many, manyTill)
import Data.Void
main :: IO ()
main = do
let parser1 = single '"' *> manyTill anySingle (single '"') :: Parsec Void String String
print $ parseMaybe parser1 "\"abc\""
let parser2 = single '"' *> many anySingle <* single '"' :: Parsec Void String String
print $ parseMaybe parser2 "\"abc\""
有了这四个,
manyTill
解析器成功匹配
abc
,因为这不依赖于回溯。与
regex-applicative
和
ReadP
,
many
解析器也成功匹配
abc
,因为它们都默认回溯。与
megaparsec
,
many
解析器无法匹配,因为它默认不回溯。到目前为止,一切都说得通。但是,与
attoparsec
,
many
解析器无法匹配,即使它确实回溯:
its documentation说“attoparsec 解析器总是在失败时回溯”和“如果您将增量输入提供给解析器,它将需要与您提供的输入量成正比的内存。(这是支持任意回溯所必需的。)”。为什么是这样?这不应该是回溯的确切含义吗?
最佳答案
Attoparsec 文档中“回溯”的含义与其他回溯解析器的回溯含义不同。
在使用 try
时查看“回溯”的含义会有所帮助对于 Parsec 或 Megaparsec 解析器。这些解析器有一个概念,即在使用输入后失败(“consume err”=cerr)与在不使用任何内容后失败(“empty err”=eerr)。对于这些解析器,p <|> q
替代运算符处理 p
的失败如果是 cerr(立即使整个 p <|> q
失败)与 eerr(尝试替代 q
),则情况不同。 try
通过将 cerr 转换为 eerr 来实现回溯。即,try p <|> q
将在事件 p
中“回溯”输入流的错误消耗cerr 失败。这是一个 单步回溯替代方案中的失败 (尽管使用嵌套的 try
调用,可以在解析失败的序列/级联中执行多个回溯步骤)。
Attoparsec 不区分 cerr 和 eerr,所以就好像所有解析器都被 try
包围。调用。这意味着它会自动执行 在替代方案中对失败进行回溯的多个步骤 .ReadP
通过同时并行评估每个可能的解析,丢弃那些曾经失败的解析,并选择剩下的“第一个”解析来隐式地回溯。 它在所有可能的解析树上“回溯”失败,无论失败是否在替代的上下文中生成。
事实证明,“在替代方案中对失败进行多步回溯”是一种比“在所有可能的解析树上回溯”更温和的回溯形式。
几个简化的示例可能有助于显示差异。考虑解析器:
(anyChar *> char 'a') <|> char 'b'
和输入字符串
"bd"
.此解析器因 Parsec/Megaparsec 而失败。左边的选择消耗
"b"
与
anyChar
在失败之前,消耗了输入(cerr),并且整个解析器失败。不过,这对 Attoparsec 工作正常:左侧替代方案在
char 'a'
处失败。 ,并且 Attoparsec 在替代尝试中回溯此失败
char 'b'
哪个成功。它也适用于
ReadP
它并行构建所有可能的解析,然后在
char 'a'
时从左侧替代方案中丢弃解析之前失败,导致
char 'b'
的单个成功解析.
(anyChar <|> pure '*') *> char 'b'
和输入字符串
"b"
. (回想一下
pure '*'
不消耗任何东西并且总是成功。)这个解析器失败了 Parsec/Megaparsec,因为
anyChar
解析
"b"
,
pure '*'
被忽略,空字符串不匹配
char 'b'
. Attoparsec 也失败了:
anyChar
成功解析
"b"
,并且在替代方案的上下文中没有失败,因此无需回溯尝试
pure '*'
选择。尝试用
char 'b'
解析空字符串随后失败。 (这个失败,如果它发生在另一个替代方案的上下文中,可能会导致该替代方案的回溯,但永远不要重新考虑这个
pure '*'
替代方案。)
ReadP
.
ReadP
并行解析备选方案,同时考虑
anyChar
解析
"b"
和
pure '*'
什么都不解析。当
char 'b'
parse 被尝试,它在前者上失败,但在后者上成功。
many p = ((:) <$> p <*> many p) <|> pure []
左替代
(:) <$> anyChar <*> many anyChar
将继续成功匹配,直到
anyChar
匹配右引号。在 EOF 时,左侧会失败(不消耗输入,尽管 Attoparsec 不在乎),而右侧会成功。替代方案中唯一的失败是在 EOF 处,它无论如何都没有消耗任何东西,因此 Attoparsec 的自动“回溯”不起作用; Megaparsec 也会做同样的事情。无论如何,一旦这个
many anyChar
已成功,即使终止
char '"'
也不会重新访问随后失败。
manyTill
明确注意终止字符。
关于parsing - 如果 attoparsec 回溯,为什么它需要 manyTill?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62586114/
我正在尝试用 C 语言编写一个使用 gstreamer 的 GTK+ 应用程序。 GTK+ 需要 gtk_main() 来执行。 gstreamer 需要 g_main_loop_run() 来执行。
我已经使用 apt-get 安装了 opencv。我得到了以下版本的opencv2,它工作正常: rover@rover_pi:/usr/lib/arm-linux-gnueabihf $ pytho
我有一个看起来像这样的 View 层次结构(基于其他答案和 Apple 的使用 UIScrollView 的高级 AutoLayout 指南): ScrollView 所需的2 个步骤是: 为 Scr
我尝试安装 udev。 udev 在 ./configure 期间给我一个错误 --exists: command not found configure: error: pkg-config and
我正在使用 SQLite 3。我有一个表,forums,有 150 行,还有一个表,posts,有大约 440 万行。每个帖子都属于一个论坛。 我想从每个论坛中选择最新帖子的时间戳。如果我使用 SEL
使用 go 和以下包: github.com/julienschmidt/httprouter github.com/shwoodard/jsonapi gopkg.in/mgo.v2/bson
The database仅包含 2 个表: 钱包(100 万行) 事务(1500 万行) CockroachDB 19.2.6 在 3 台 Ubuntu 机器上运行 每个 2vCPU 每个 8GB R
我很难理解为什么在下面的代码中直接调用 std::swap() 会导致编译错误,而使用 std::iter_swap 编译却没有任何错误. 来自 iter_swap() versus swap() -
我有一个非常简单的 SELECT *用 WHERE NOT EXISTS 查询条款。 SELECT * FROM "BMAN_TP3"."TT_SPLDR_55E63A28_59358" SELECT
我试图按部分组织我的 .css 文件,我需要从任何文件访问文件组中的任何类。在 Less 中,我可以毫无问题地创建一个包含所有文件导入的主文件,并且每个文件都导入主文件,但在 Sass 中,我收到一个
Microsoft.AspNet.SignalR.Redis 和 StackExchange.Redis.Extensions.Core 在同一个项目中使用。前者需要StackExchange.Red
这个问题在这里已经有了答案: Updating from Rails 4.0 to 4.1 gives sass-rails railties version conflicts (4 个答案) 关
我们有一些使用 Azure DevOps 发布管道部署到的现场服务器。我们已经使用这些发布管道几个月了,没有出现任何问题。今天,我们在下载该项目的工件时开始出现身份验证错误。 部署组中的节点显示在线,
Tip: instead of creating indexes here, run queries in your code – if you're missing any indexes, you
你能解释一下 Elm 下一个声明中的意思吗? (=>) = (,) 我在 Elm architecture tutorial 的例子中找到了它 最佳答案 这是中缀符号。实际上,这定义了一个函数 (=>
我需要一个 .NET 程序集查看器,它可以显示低级详细信息,例如元数据表内容等。 最佳答案 ildasm 是 IL 反汇编程序,具有低级托管元数据 token 信息。安装 Visual Studio
我有两个列表要在 Excel 中进行比较。这是一个很长的列表,我需要一个 excel 函数或 vba 代码来执行此操作。我已经没有想法了,因此转向你: **Old List** A
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想要改善这个问题吗?更新问题,以便将其作为on-topi
我正在学习 xml 和 xml 处理。我无法很好地理解命名空间的存在。 我了解到命名空间帮助我们在 xml 中分离相同命名的元素。我们不能通过具有相同名称的属性来区分元素吗?为什么命名空间很重要或需要
我搜索了 Azure 文档、各种社区论坛和 google,但没有找到关于需要在公司防火墙上打开哪些端口以允许 Azure 所有组件(blob、sql、compute、bus、publish)的简洁声明
我是一名优秀的程序员,十分优秀!