x86-64 - 如何编写 X86_64 _汇编器

x86-64 - 如何编写 X86_64 _汇编器_？

转载作者：行者123 更新时间：2023-12-02 07:06:11

37

4

目标:我想编写一个 X86_64 汇编器。注意:标记为社区维基

背景:我熟悉C语言，以前写过MIPS汇编。我写了一些 x86 程序集。但是，我想编写一个 x86_64 汇编器 - 它应该输出我可以跳转到并开始执行的机器代码(就像在 JIT 中一样)。

问题是:解决这个问题的最佳方法是什么？我意识到这个问题看起来很难解决。我想从一个基本的最低限度开始:

加载到寄存器
寄存器上的算术运算(只需整数就可以了，还不需要搞乱 FPU)
条件
跳跃

只是一个使其图灵完备的基本集合。有人做过这个吗？建议/资源？

最佳答案

与任何其他“编译器”一样，汇编器最好编写为输入到语言语法处理器中的词法分析器。

汇编语言通常比常规编译语言更容易，因为您无需担心构造跨越行边界，并且格式通常是固定的。

大约两年前，出于教育目的，我为(虚构的)CPU 编写了一个汇编程序，它基本上将每一行视为:

可选标签(例如:loop)。
操作(例如，mov)。
操作数(例如，ax,$1)。

最简单的方法是确保 token 易于区分。

这就是为什么我制定了标签必须以 : 开头的规则 - 它使该行的分析变得更加容易。处理一行的过程是:

删除注释(第一个 ; 位于字符串之外到行尾)。
提取标签(如果有)。
第一个词就是操作。
其余部分是操作数。

您可以轻松地坚持不同的操作数也有特殊的标记，以使您的生活更轻松。所有这一切都假设您可以控制输入格式。如果您需要使用 Intel 或 AT&T 格式，那就有点困难了。

我的方法是调用一个简单的每个操作函数(例如，doJmp、doCall、doRet )并且该函数决定操作数中允许的内容。

例如，doCall 只允许使用数字或标签，doRet 不允许任何内容。

例如，以下是来自 encInstr 函数的代码段:

private static MultiRet encInstr(
    boolean ignoreVars,
    String opcode,
    String operands)
{
    if (opcode.length() == 0) return hlprNone(ignoreVars);
    if (opcode.equals("defb"))  return hlprByte(ignoreVars,operands);
    if (opcode.equals("defbr")) return hlprByteR(ignoreVars,operands);
    if (opcode.equals("defs"))  return hlprString(ignoreVars,operands);
    if (opcode.equals("defw"))  return hlprWord(ignoreVars,operands);
    if (opcode.equals("defwr")) return hlprWordR(ignoreVars,operands);
    if (opcode.equals("equ"))   return hlprNone(ignoreVars);
    if (opcode.equals("org"))   return hlprNone(ignoreVars);

    if (opcode.equals("adc"))   return hlprTwoReg(ignoreVars,0x0a,operands);
    if (opcode.equals("add"))   return hlprTwoReg(ignoreVars,0x09,operands);
    if (opcode.equals("and"))   return hlprTwoReg(ignoreVars,0x0d,operands);

hlpr... 函数只是获取操作数并返回一个包含指令的字节数组。当许多操作具有类似的操作数要求时，它们非常有用，例如 adc、add 和 and` 在上述情况下都需要两个寄存器操作数(第二个参数控制什么操作码)已返回指令)。

通过使操作数的类型易于区分，您可以检查提供了哪些操作数、它们是否合法以及要生成哪些字节序列。将操作分离到它们自己的函数中提供了一个很好的逻辑结构。

此外，大多数 CPU 都遵循从操作码到操作的合理逻辑转换(以使芯片设计人员的工作更轻松)，因此所有操作码上都会有非常相似的计算，例如允许索引寻址。

为了在允许可变长度指令的 CPU 中正确创建代码，最好分两遍完成。

在第一遍中，不生成代码，只生成指令的长度。这允许您在遇到所有标签时为其分配值。第二遍将生成代码并可以填充对这些标签的引用，因为它们的值是已知的。上面代码段中的 ignoreVars 用于此目的(返回代码的字节序列，以便我们可以知道长度，但对符号的任何引用都只使用 0)。

关于x86-64 - 如何编写 X86_64 _汇编器_？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3074004/

37

4

0

文章推荐： excel - 查找匹配值的行号

文章推荐： excel - 如何使用Excel进行项目管理？

文章推荐： arrays - 原始声音 byteArray 到 float Array

c - 如何生成 _ _ _ 形式的随机数。 _ _ _ _(C语言)
过去几天我一直试图解决这个问题，但我做不到。我正在尝试生成 _ _ _ 形式的随机数。 _ _ _ _ 小数点前 3 位，然后是 4 位小数。非常感谢任何帮助。谢谢，院长最佳答案您发布的代码有
java - 生成 "_ _ _ "的方法仅返回 "_ "
我的方法有问题。我需要从主类调用的方法的输出打印我: 需要这个输出:_ _ _ _ _ 我知道我可以将 System 的静态方法放入循环中，但这不是我想要的解决方案。我需要它来打印主类中方法的输出。
scala - 为什么 ((_ : Int, _ : Int) => _/_) not compile when ((_: Int)/(_: Int)) does?
我正在学习 Scala，有一个非常基本的问题。考虑以下两个使用占位符语法的表达式 - // Syntax A val fnA = (_: Int, _: Int) => _ / _ // Synta
ios - swift 无法将类型 (_, _) -> _ 的值转换为预期的参数类型 '((_, CGFloat)) -> _
我正在使用图书馆 URLEmbeddedView 它在其库中定义了以下代码: func addConstraints(with view: UIView, center: CGPoint, multi
haskell - 这个语法在 Haskell 中是什么意思 : _|_ or (_|_)
我一直在许多受人尊敬的文档中看到这个相当令人尴尬的事情:_|_ 或 (_|_) 找不到它的定义(Google 不能很好地处理符号)。那到底是什么呢？最佳答案来自 here :- Bottom Th
bash - 这个命令在 bash 中有什么作用 : , _,( ){ ,_,| ,_,&};,_,
,_,( ){ ,_,| ,_,&};,_, 不知道是什么意思... 看起来像一个 bash 命令，但它可能是 s bash shell 指令或其他东西如果有人可以帮助理解这一点，我们将不胜感激。当我
haskell - 模式不匹配 : (_:_:_)
所以我正在尝试构建一个函数，它接受一个元组列表并找到具有最大第二个元素的元组。但是我遇到了模式匹配错误。这是我的代码。 resultTuple :: [((Int,Int),Int)] ->
javascript - 流量: Cannot assign _ to _ because property _ is missing in _
我在 try Flow 编辑器中重现了我的情况，可以访问 here . 以下是链接发生问题时的代码: /* @flow */ type PayloadType = 1 | 2 | 3; type Tr
agda - _≡⟨_⟩_ Agda 标准库在哪里？
我在plfa读到这样一段代码。 import Relation.Binary.PropositionalEquality as Eq open Eq using (_≡_; refl; cong; s
swift - 最大(_ :_:) and min(_:_:) in an Int extension in Swift
这个问题在这里已经有了答案: Swift 3.0: compiler error when calling global func min(T,T) in Array or Dictionary e
javascript - Underscore 的类似函数 : _. 包含 vs. _.some 和 _.map vs _.each
是否有理由使用一个而不是另一个？似乎 _.some 和 _.map 更易于使用或适用于更多情况(根据我非常有限的经验)，但从阅读它来看，它们听起来好像应该做同样的事情。我敢肯定还有其他这样的例子，我很
ios - 无法使用类型为 'dataTaskWithRequest' 的参数列表调用 '(NSMutableURLRequest, (_, _, _) throws -> _)'
在 Xcode 7 Beta 中开始使用 Swift 2 后，出现错误 cannot invoke。是什么导致了这个问题？我试图通过以下两个问题找出我的问题，但我仍然收到错误:Question 1
scala - 为什么编译器想不通 (_ > : T) => (_ <: V[_ <: U]) <: T => V[U] for V[+_]?
所以我玩了一会儿，试图写一些关于存在和变化的东西，我遇到了这段有趣的代码。 final case class Box[+T](val value: T) { def >>=[U](f: T =>
ios - Objective-C iOS 中的谷歌地图集成问题(_ OBJC _ CLASS _ $ _ GMSPlacesClient，引用自 :)
Here is the screenshot for the error. 遵循本教程 https://developers.google.com/places/ios-api/start 在本教程中
javascript - 如何使用 _.reduce(和 _.each)从 Underscore.js 重写 _.every/_.all
我正在为许多标准的 Underscore.js 函数重写底层代码，以提高我的 JavaScript 技能，但我有点受困于 _.every/ _.全部。似乎在库本身中，_.every/_.all 函数仅
linux - if比较中加入 "_"的原因 "if [ "_$str"= "_"]; then ....; fi"
我在 shell 脚本中多次看到他们在 if 比较中使用 "_"，如下所示: if [ "_$str" = "_" ]; then ....; fi 上面的代码通过比较 if [ "_$str"= "
ios - Swift 过滤器字典错误 : Cannot assign a value of type '[(_, _)]' to a value of type '[_ : _]'
我正在尝试快速过滤字典: var data: [String: String] = [:] data = data.filter { $0.1 == "Test" } 上面的过滤器代码在 Swift
c# - 不支持从 _ 到 _ 的关系，因为拥有的实体类型 _ 不能位于非所有权关系的主体端
我在 Entity Framework 核心映射方面遇到了问题。我收到此异常“不支持从‘付款’到‘购买。付款’的关系，因为拥有的实体类型‘购买’不能位于非所有权关系的主要方面。”在调试此功能的测试时。
grails - 模拟groovy.sql.Sql.call(_，_，_)方法
我正在尝试模拟groovy.sql.Sql调用(查询，params []，闭包)类。下面是我正在尝试在DatabaseService类文件中的方法。 public void getUsers(Lis
flutter - 在 dart/flutter 中调用函数时传递下划线 _ "_"(_) 是什么意思？
在阅读 dart 代码时，我经常看到一些仅使用下划线 _ 参数调用的函数。这让我困扰了一段时间，由于 flutter 改进了它的分析消息，我有了一些线索......但我觉得我并没有真正理解这个概念:-

首页

博学

6Ren·AI

商城

x86-64 - 如何编写 X86_64 _汇编器_？