parsing - 在 Haskell 中解析谓词-6ren

parsing - 在 Haskell 中解析谓词

转载作者：行者123 更新时间：2023-12-05 04:24:52

26

4

我想解析一个谓词，例如:"3 > 2" 或 "MyVar = 0"。

理想情况下，我会使用一个小的 GADT 来表示谓词:

data Expr a where
    I   :: Int  -> Expr Int
    B   :: Bool -> Expr Bool
    Var :: String -> Expr Int
    Add :: Expr Int -> Expr Int -> Expr Int
    Eq  :: Eq a => Expr a -> Expr a -> Expr Bool
    Mt  :: Eq a => Expr a -> Expr a -> Expr Bool

表达式 3 > 2 将解析为 Mt (I 3) (I 2)。

我试图用 Parsec 来解决这个问题。但是，模块 Text.Parsec.Expr只处理表达式，类型为 a -> a -> a。有什么建议吗？

最佳答案

直接解析成 GADT 实际上有点棘手。根据我的经验，通常最好先解析为无类型的 ADT(其中 a -> a -> a 类型很自然)，然后通过转换它来单独“类型检查”ADT进入所需的 GADT。主要缺点是您必须为非类型化和类型化抽象语法树定义两种并行类型。 (从技术上讲，您可以使用一些类型级别的技巧来解决这个问题，但对于小型语言来说，这是不值得的。)但是，最终的设计更易于使用，而且通常更灵活。

换句话说，我建议使用 Parsec 来解析为未类型化的 ADT:

data UExpr where
  UI :: Int -> UExpr
  UB :: Bool -> UExpr
  UVar :: String -> UExpr
  UAdd :: UExpr -> UExpr -> UExpr
  UEq :: UExpr -> UExpr -> UExpr
  UMt :: UExpr -> UExpr -> UExpr

然后写一个类型检查器:

tc :: UExpr -> Expr a

实际上，您无法像那样编写tc。相反，您需要将其分解为针对不同表达式类型的相互递归类型检查器:

tc_bool :: UExpr -> Expr Bool
tc_int :: UExpr -> Expr Int

您可能希望在提供有效变量列表的 Reader monad 中运行它们。 (类型检查通常涉及检查变量的类型。在您的情况下，您只有整数变量，但确保在类型检查阶段定义变量仍然有意义。)

如果您遇到困难，将有一个完整的解决方案...

剧透

.

正如我所说，我首先会为未类型化的 UExpr ADT 编写一个 Parsec 解析器。请注意，Text.Parsec.Expr 机制适用于 UExpr -> UExpr -> UExpr 运算符:

{-# LANGUAGE GADTs #-}
{-# LANGUAGE StandaloneDeriving #-}
{-# LANGUAGE FlexibleInstances #-}
{-# LANGUAGE FlexibleContexts #-}
{-# OPTIONS -Wall -Wno-missing-signatures #-}

import Text.Parsec
import Text.Parsec.Expr
import Text.Parsec.String
import Text.Parsec.Language
import Control.Monad.Reader
import Control.Exception
import Data.Maybe (fromJust)
import qualified Text.Parsec.Token as P

lexer = P.makeTokenParser haskellDef { P.reservedNames = ["true","false"] }

identifier = P.identifier lexer
integer = P.integer lexer
parens = P.parens lexer
reserved = P.reserved lexer
reservedOp = P.reservedOp lexer
symbol = P.symbol lexer

data UExpr where
  UI :: Int -> UExpr
  UB :: Bool -> UExpr
  UVar :: String -> UExpr
  UAdd :: UExpr -> UExpr -> UExpr
  UEq :: UExpr -> UExpr -> UExpr
  UMt :: UExpr -> UExpr -> UExpr
  deriving (Show)

expr :: Parser UExpr
expr = buildExpressionParser
  [ [Infix (UAdd <$ reservedOp "+") AssocLeft]
  , [Infix (UEq <$ reservedOp "=") AssocNone, Infix (UMt <$ reservedOp ">") AssocNone]
  ] term

term :: Parser UExpr
term = parens expr
  <|> UI . fromIntegral <$> integer
  <|> UB True <$ reserved "true"
  <|> UB False <$ reserved "false"
  <|> UVar <$> identifier

test_parser :: IO ()
test_parser = do
  parseTest expr "3 > 2"
  parseTest expr "MyVar = 0"

然后，我会编写一个类型检查器，可能类似于以下内容。请注意，对于类型检查，我们只需要验证变量名是否存在；我们不需要他们的值(value)观。但是，我使用了一个 Ctx 类型来进行类型检查和评估。

-- variable context (i.e., variable name/value pairs)
type Ctx = [(String, Int)]

data Expr a where
  I   :: Int  -> Expr Int
  B   :: Bool -> Expr Bool
  Var :: String -> Expr Int
  Add :: Expr Int -> Expr Int -> Expr Int
  Eq  :: (Show (Expr a), Eq a) => Expr a -> Expr a -> Expr Bool
  Mt  :: (Show (Expr a), Ord a) => Expr a -> Expr a -> Expr Bool
deriving instance Show (Expr Bool)
deriving instance Show (Expr Int)

tc_bool :: UExpr -> Reader Ctx (Expr Bool)
tc_bool (UB b) = pure $ B b
tc_bool (UEq x y) = Eq <$> tc_int x <*> tc_int y
tc_bool (UMt x y) = Mt <$> tc_int x <*> tc_int y
tc_bool _ = error "type error: expecting a boolean expression"

tc_int :: UExpr -> Reader Ctx (Expr Int)
tc_int (UI n) = pure $ I n
tc_int (UVar sym)
  = do mval <- asks (lookup sym)
       case mval of Just _ -> pure $ Var sym
                    _      -> error "type error: undefined variables"
tc_int (UAdd x y) = Add <$> tc_int x <*> tc_int y
tc_int _ = error "type error: expecting an integer expression"

test_tc :: IO ()
test_tc = do
  print $ run_tc_bool (UMt (UI 3) (UI 2))
  print $ run_tc_bool (UEq (UVar "MyVar") (UI 0))
  -- now some type errors
  handle showError $ print $ run_tc_bool (UMt (UB False) (UI 2))
  handle showError $ print $ run_tc_bool (UAdd (UEq (UI 1) (UI 1)) (UI 1))

  where showError :: ErrorCall -> IO ()
        showError e = print e

        run_tc_bool e = runReader (tc_bool e) [("MyVar", 42)]

您可能会惊讶地发现，编写类型检查器的最自然方式实际上并不是“使用”GADT。它可以同样容易地使用 bool 和整数表达式的两种不同类型来编写。如果您真的尝试直接解析到 GADT 中，您会发现同样的事情。解析器代码需要非常清楚地分为 Parser (Expr Bool) 类型的 bool 表达式解析器和 Parser (Expr Int) 类型的整数表达式解析器，并且没有直接的方法来编写单个 Parser (Expr a)。

实际上，GADT 表示的优势只体现在评估阶段，您可以编写一个简单的、类型安全的评估器，不会触发“非穷举模式”警告，如下所示:

eval :: Expr a -> Reader Ctx a
eval (I n) = pure n
eval (B b) = pure b
eval (Var sym) = fromJust <$> asks (lookup sym)
eval (Add x y) = (+) <$> eval x <*> eval y
eval (Eq x y) = (==) <$> eval x <*> eval y
eval (Mt x y) = (>) <$> eval x <*> eval y

test_eval :: IO ()
test_eval = do
  print $ run_eval (Mt (I 3) (I 2))
  print $ run_eval (Eq (Var "MyVar") (I 0))

  where run_eval e = runReader (eval e) [("MyVar", 42)]

关于parsing - 在 Haskell 中解析谓词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/73405393/

26

4

0

文章推荐： r - 等号更改生存对象自动绘图中图例标签的呈现

文章推荐： python - 如果值不在使用 python 的数据中，则跳过文件

文章推荐： python - Pandas 每行获得前 n 列

文章推荐： python - 使用字典交叉数据框列 "contains List"

java - 尽管有默认的 "OR"谓词，但 ViewerFilter 上的 "And"谓词？
我正在开发一个包含 TreeViewer 的 RCP 应用程序，我想在其上激活多个应与“OR”谓词配合使用的过滤器，例如: A |--B |--|--redColor |--|--blueColor
c++ - 我的类型在 std 函数中未能通过 enable_if 谓词。有没有办法 "debug"谓词？
我的问题是关于 enable_if通常标准库中的谓词，但我将在迭代器类型的上下文中构建它，因为这是我目前遇到此问题的地方。我有一个自定义迭代器类型 It , 这样 std::iterator_tra
Scala 谓词
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 4年前关闭。 Improve thi
Prolog 谓词 - 无限循环
我需要使用自然数为 2 的幂创建一个 Prolog 谓词。自然数是:0、s(0)、s(s(0)) 等等。例如: ?- pow2(s(0),P). P = s(s(0)); false. ?- po
iphone - 核心数据 ANY BETWEEN 谓词
我正在尝试创建一个 NSPredicate 来查找在特定日期范围内包含“ session ”的“项目”。我一开始尝试过这个: [NSPredicate predicateWithFormat:@"AN
Prolog powerset 谓词
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
java - 如何在JOOQ中编写多字段 `in`谓词？
在JOOQ中，我可以编写如下SQL这样的代码吗？我不知道如何编写具有多个字段的in谓词。 select some_value from t1 where (t1.id1, t1.id2) i
具有可变数量参数的 Prolog 谓词
我正在用 PROLOG 编写一个数独求解器。我希望求解器能够处理所有可能大小的数独，因此我自然需要构造采用可变数量参数的谓词。 (例如在数独中构建“ block ”。) 如何构造或模拟具有可变数量参数
java - 如何在Ebean中实现 "not in"谓词？
我有一个包含一些 id 的列表，我希望我的 ebean 查询排除这些 id。所以基本上我需要在 ebean 中使用“not in”谓词，就像 sql 一样，但遗憾的是找不到。还有其他方法可以实现这一目
c# - 如何创建一个通用方法来遍历对象的字段并将其用作 Where 谓词？
我正在构建一个通用接口(interface)以从类中公开选定的字符串属性，然后我想在每个字段中搜索文本，以检查它是否匹配。这是我的 IFieldExposer接口(interface): using
java - 搜索嵌套对象的规范/谓词
我将 Spring Boot 与 Spring JPA 和 Specification Executor 结合使用。我的规范/谓词组合成功地在我的类中搜索了简单的属性。但是，我在搜索其中的对象时遇到了
MySQL 并跳过 WHERE 谓词
如果下面的 last_name 为 NULL，它会跳过该列的 WHERE 比较以提高性能吗？ AND (last_name IS NULL OR sp.last_name LIKE CONCAT('%
c++ - 谓词...或其他术语？
出于好奇:如果我有一个接受多个参数(通常为 1 或 2)并返回 3 个值中的 1 个(而不是 bool 值 true 或 false)的类运算符(或函数等)，它是否仍应被调用谓词？还是模糊逻辑的特例？
返回装箱值类型是否为该类型的默认值的 C# 谓词
是否可以创建一个采用装箱值类型并返回该值类型是否等于该类型默认值的方法？所以我想创建一个具有以下签名的方法: bool IsDefault(object boxedValueType); 注意:当
swift - RealmSwift ALL 谓词
let selectedConsoles = ["Xbox", "Playstation 4"] let players = realm.objects(Person).filter("console
swift - NSSet 谓词
我正在尝试根据用户搜索文本过滤来自核心数据的结果，但效果很好。我正在努力做到有几个关键术语可以返回特定结果。我有一个Colour 实体，它与另一个实体ProjectColour 具有对多关系。 P
C++ is_str_empty 谓词
std::vector lines; typedef std::vector::iterator iterator_t; iterator_t eventLine = std::find_if(lin
c# - IndexOf 谓词？
我想在一个列表中找到一个元素的索引，该列表匹配某个谓词，有没有比以下更好的方法: var index = list.IndexOf(list.Find(predicate)); ? 最佳答案你在找
prolog - 高阶 "solutions"谓词
我正在使用缺少 findall 的高阶 Prolog 变体. 还有一个关于实现我们自己的问题 findall这里:Getting list of solutions in Prolog . 低效的实现
breeze - 如何测试空的 Breeze 谓词？
我正在使用 Breeze 过滤客户端请求的数据。我的代码看起来有点像这样: 客户端 - 创建过滤谓词 var predicates = []; var criteriaPredicate = null

首页

博学

6Ren·AI

商城

parsing - 在 Haskell 中解析谓词