parsing - 避免具有许多类似构造函数的数据类型的代码重复-6ren

parsing - 避免具有许多类似构造函数的数据类型的代码重复

转载作者：行者123 更新时间：2023-12-02 02:04:50

25

4

我正在用 Haskell 编写一个简单的解析器，并拥有这个保存解析结果的数据类型。

data AST = Imm Integer
    | ArgName String
    | Arg Integer
    | Add AST AST
    | Sub AST AST
    | Mul AST AST
    | Div AST AST
    deriving (Show, Eq)

当我想在树上映射以使用映射将变量名替换为其引用号时，问题就来了。我必须写这段代码

refVars :: M.Map String Integer -> AST -> Maybe AST
refVars d (ArgName s) = case d M.!? s of
                            Just n -> Just (Arg n)
                            Nothing -> Nothing
refVars _ (Imm n)     = Just $ Imm n
refVars _ (Arg n)     = Just $ Arg n                       
refVars d (Add a1 a2) = Add <$> refVars d a1 <*> refVars d a2
refVars d (Sub a1 a2) = Sub <$> refVars d a1 <*> refVars d a2
refVars d (Mul a1 a2) = Mul <$> refVars d a1 <*> refVars d a2
refVars d (Div a1 a2) = Div <$> refVars d a1 <*> refVars d a2

这似乎令人难以置信的多余。理想情况下，我想要一个匹配任何(op a1 a2)的模式，但 Haskell 不允许这样做。有什么建议么？

最佳答案

根据建议 in the comments ，解决您当前问题的方法是将有关运算符类型的信息移出构造函数:

data Op = Add | Sub | Mul | Div
data AST = Imm Integer
    | ArgName String
    | Arg Integer
    | Op Op AST AST

这个数据类型对所有的二进制操作都有一个构造函数，所以你只需要一行来把它拆开:

refVars :: M.Map String Integer -> AST -> Maybe AST
refVars d (ArgName s)   = Arg <$> d !? s
refVars _ (Imm n)       = Just $ Imm n
refVars _ (Arg n)       = Just $ Arg n                       
refVars d (Op op a1 a2) = Op op <$> refVars d a1 <*> refVars d a2

无需修改 refVars 即可处理所有不同类型的二元运算符，但如果您向 AST 添加不同的句法形式，则必须向 refVars 添加子句.

data AST = -- other constructors as before
    | Ternary AST AST AST
    | List [AST]
    | Call AST [AST]  -- function and args

refVars -- other clauses as before
refVars d (Ternary cond tt ff) = Ternary <$> refVars d cond <*> refVars d tt <*> refVars d ff
refVars d (List l) = List <$> traverse (refVars d) l
refVars d (Call f args) = Call <$> refVars d f <*> traverse (refVars d) args

所以它仍然很乏味 - 这段代码所做的只是遍历树到叶子，因此 refVars可以检查叶子是否是 ArgName或其他。 refVars 的有趣部分是一个 ArgName线;该函数的其余六行是纯样板文件。
如果我们可以将“遍历树”与“句柄 ArgName s”分开定义，那就太好了。这就是泛型编程的用武之地。有很多泛型编程库，每个都有自己的风格和方法，但我将使用 lens 进行演示.
Control.Lens.Plated 模块定义了 Plated 知道如何访问他们的 child 的类型的类。交易是:你显示 lens如何访问您的 child (通过将它们传递给回调 g )和 lens可以递归地应用它来访问 child 的 child 等等。

instance Plated AST where
    plate g (Op op a1 a2) = Op op <$> g a1 <*> g a2
    plate g (Ternary cond tt ff) = Ternary <$> g cond <*> g tt <*> g ff
    plate g (List l) = List <$> traverse g l
    plate g (Call f args) = Call <$> g f <*> traverse g args
    plate _ a = pure a

Aside: you might object that even writing plate clause-by-clause is rather too much boilerplate. The compiler should be able to locatethe AST's children for you. lens has your back — there's a defaultimplementation of plate for any type which is an instance ofData,so you should be able to slap deriving Data onto AST and leave thePlated instance empty.

现在我们可以实现 refVars使用 transformM :: (Monad m, Plated a) => (a -> m a) -> a -> m a .

refVars :: M.Map String Integer -> AST -> Maybe AST
refVars d = transformM $ \case
    ArgName s -> Arg <$> d !? s
    x -> Just x

transformM采用(单子(monad))转换函数并将其应用于 AST 的每个后代。我们的转换函数搜索 ArgName节点并将它们替换为 Arg节点，留下任何非- ArgName s 不变。
更详细的解释见 this paper (或 the accompanying slides，如果您愿意的话)作者是 Neil Mitchell。这就是 Plated模块基于。

关于parsing - 避免具有许多类似构造函数的数据类型的代码重复，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62640325/

25

4

0

文章推荐： scala - Play Framework 2 重新编译所有文件而不是一个文件

文章推荐： ruby-on-rails - 条件 order_by 取决于 Sunspot 中的数据

文章推荐： magento - 在 magento 上捕获重新排序事件

方案说明(构造)
谁能解释一下原因: (define a (lambda() (cons a #f))) (car (a)) ==> procedure ((car (a))) ==> (procedure . #f)
Python "here, . . . where"构造
这是 PyBrain 网站的摘录。我了解大部分正在发生的事情，但是一行让我完全难住了。我以前从未在 python 代码中看到过这样的东西。这是整个循环，对于上下文: for c in [0,
groovy - 构造/销毁自定义Gradle任务
我是gradle / groovy的新手。我想创建将做一些事情的自定义任务。我的第一个问题是任务完成时该如何做？我可以覆盖doFirst / doLast闭包吗？也许我可以重写某些在开始和结束时都会执
c# 构造
我刚刚开始评估 MS 企业库。他们使用以下指令来获取实例: var customerDb = EnterpriseLibraryContainer.Current.GetInstance("C
ansible if else 构造
这是我的 if else Ansible 逻辑.. - name: Check certs exist stat: path=/etc/letsencrypt/live/{{ rootDomain
Python 构造 - 解析可变数量的可变长度记录
我正在使用construct 2.8 对一些失传已久的 Pascal 程序创建的一些文件的 header 进行逆向工程。 header 由许多不同的记录组成，其中一些是可选的，我不确定顺序是否固定。
构造 char 指针数组
我在将 getchar() 的输入放入 char *arr[] 数组时遇到问题。我这样做的原因是因为输入数据(将是一个带有命令行参数的文件)将存储在一个 char 指针数组中以传递给 execvp 函
c# - 构造/制作通用类型并将类型约束转换为结构作为基础类型的约束
通常我们不能约束类型参数 T派生自密封类型(例如 struct 类型)。这将毫无意义，因为只有一种类型适合，因此不需要泛型。所以约束如下: where T : string 或: where T :
Java - REGEX 构造
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
C++构造、解构和指向类对象的机制
#include using namespace std; class A { private: int m_i; friend int main(int argc, char cons
javascript - 如何在javascript中使用 "with"构造？
这个问题在这里已经有了答案: Are there legitimate uses for JavaScript's "with" statement? (33 个答案) 关闭 9 年前。我有这个代
Bash 构造 $(< 文件)
在this answer我看到了下一个 Bash 结构。 yes "$(< file.txt)" 什么意思 "$(< file.txt)" ? 我明白了命令替换 - $(command)用命令的结
c++ - If Else 构造
if (a == 1) //do something else if (a == 2) //do something else if (a == 3) //do somethi
c# - ListViewItem 构造
关于构造的快速简单的问题。我有以下用于将项目添加到 ListView 的代码。 ListViewItem item = new ListViewItem(); item.Text = file; i
具有给定内存的c++ vector 构造
我想使用 std::vector 来控制给定的内存。首先，我很确定这不是好的做法，但好奇心占了上风，无论如何我都想知道如何做到这一点。我遇到的问题是这样的方法: vector getRow(unsi
连接字符串中的 Javascript 构造
下面显示了一段简单的javascript: var mystring = ("random","ignored","text","h") + ("ello world") 这个字符串会生成 hello
java - 新对象 { } 构造
在 Java 中，创建对象的标准方法是使用 MyClass name = new MyClass(); 我也经常看到构造 new MyClass() { /*stuff goes in here*/
c++ - 有没有办法在编译时从 initializer_list 构造？
我正在编写 C++ ndarray 类。我需要动态大小和编译时大小已知的数组(分别分配自由存储和分配堆栈)。我想支持从嵌套的 std::initializer_list 进行初始化。动态大小的没问题
visual-studio-2008 - () => 构造
我正在将一个项目从 Visual Studio 2005 转换为 Visual Studio 2008，并提出了上述结构。 using Castle.Core.Resource; using Cast
.net - 依赖注入(inject) - 构造
我想知道我在这里的想法是否正确，我主要针对接口(interface)进行编程，所以我想知道下面的类是否应该通过 DI 注入(inject)，或者我应该自己实例化一个类... 注意:这些服务保存在我的核

首页

博学

6Ren·AI

商城

parsing - 避免具有许多类似构造函数的数据类型的代码重复