gpt4 book ai didi

parsing - haskell /三连胜 : Parsing completely optional semicolons without polluting AST

转载 作者:行者123 更新时间:2023-12-02 14:30:09 26 4
gpt4 key购买 nike

我重写了这个问题,因为它最初是用更简洁的代码示例发布的:

将具有完全可选分号的语言视为糖,即:

  • ;;富; bar;;;;有效
  • foo bar foobar 有效
  • 如果(+1); foo 在语义上与 if (+1) foo 不同,因此 ; 不能被视为空格

这是一个示例解析器:

{-# LANGUAGE OverloadedStrings #-}

import Text.Trifecta
import Text.Trifecta.Delta
import Text.PrettyPrint.ANSI.Leijen (putDoc, (<>), linebreak)
import Control.Monad.Trans.State.Strict
import Control.Applicative

type TestParser a = StateT Int Parser a

data AST a = Foo a | Bar a deriving (Show)

pFoo :: TestParser (AST (Delta, Int))
pFoo = curry Foo <$ string "foo" <*> position <* modify (+1) <*> get

pBar :: TestParser (AST (Delta, Int))
pBar = curry Bar <$ string "bar" <*> position <*> get

pStmt :: TestParser (AST (Delta, Int))
pStmt = semi *> pStmt <|> pFoo <|> pBar <?> "statement"

pTest :: TestParser [AST (Delta, Int)]
pTest = some pStmt

main :: IO ()
main
= do let res = parseByteString (evalStateT pTest 0)
(Directed "(test)" 0 0 0 0) ";;foo;bar;\nfoo;; foobarbar;;"
case res of
Success ast
-> print ast
Failure errdoc
-> putDoc (errdoc <> linebreak)

我在使用这样的解析器时遇到的问题是我需要能够跳过分号而不 promise 解析pStmt。目前出现以下错误:

(test):2:18: error: unexpected
EOF, expected: statement
foo;; foobarbar;;<EOF>

这是因为它需要一个语句(在 semi *> pStmt 中),但是因为堆叠的分号可以给表达式的开头和结尾加糖,所以我不确定我是否真的想要期望/在我期待一个之前解析一个。

我开发的一个 hack 是在我的 AST 中使用 Nop 作为构造函数,但我真的不想这样做 - 这感觉就像一个 hack,并且在某些地方有分号的数量文档显示这会大大增加内存使用量。

我正在寻找解决方案/建议。

<小时/>

尝试所需语法的 EBNF 形式:

expr = "foo" | "bar"
expr with sugar = expr | ";"
program = { [white space], expr with sugar, [white space] }

最佳答案

好的,这是:

pStmt = pFoo <|> pBar

pWhiteStmt = do
many whitespace
p <- pStmt
many whitespace
return p

pTest = do
many semi
pS <- sepEndBy pWhiteStm (some semi)
eof
return pS

并测试它:

> parse pTest "" ";;foo;bar;\nfoo;; foo;bar;bar;;"
Right ["foo","bar","foo","foo","bar","bar"]

> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Left (line 2, column 10):
unexpected 'b'
expecting ";" or end of input

如果我们希望有一个有效的 "; foobarbar;",那么我们需要将 pWhiteStmt 解析器更改为下一个:

pWhiteStmt = do
many whitespace
p <- some pStmt
many whitespace
return p

并检查它:

> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Right [["foo"],["bar"],["foo"],["foo","bar","bar"]]

最后,如果我们仍然希望拥有有效的 "; foo bar baz;" 那么我们还需要将 pTest 函数更改为下一个:

pTest = do
many semi
pS <- sepEndBy (some pWhiteStm) (some semi)
eof
return pS

并测试它

> parse pTest "" ";;foo;bar;\nfoo;; foo bar bar;;"
Right [[["foo"]],[["bar"]],[["foo"]],[["foo"],["bar"],["bar"]]]

如果我们有很多括号,则需要将pWhiteStmt中的return p替换为return (concat p)

关于parsing - haskell /三连胜 : Parsing completely optional semicolons without polluting AST,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20139957/

26 4 0