- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
对我之前的question的回答表示 Haskell 代表 plusWord2#
如 llvm.uadd.with.overflow
。我希望对进位进行长加法,就像 x86 ADC 指令的工作原理一样。该指令不仅将其两个参数相加,而且还将进位位的内容相加。
然后可以添加长数字,如下所示:
ADD x1 y1
ADC x2 y2
ADC x3 y3
...
每个单词产生一条指令(忽略任何所需的周围移动等)。
我查看了 GMP 库,以及它如何在其通用 C 代码中进行长加法本身。这是 mpn/generic/add_n.c
的摘录
sl = ul + vl;
cy1 = sl < ul;
rl = sl + cy;
cy2 = rl < sl;
cy = cy1 | cy2;
请注意,它保存了原始加法和进位位加法中的进位位。这些操作中只有一个可以进位,因此随后对进位进行或运算就足够了。
显然 GMP 对于特定平台有特定的汇编代码,但我认为通用代码将是一个很好的基础,因为它可能会被编写为编译为合理的代码。 plusWord2#
原始操作意味着我不需要进行愚蠢的比较来获取进位位,因此我在 Haskell 中实现了 GMP 通用代码,如下所示:
addWithCarry :: Word# -> Word# -> Word# -> (# Word#, Word# #)
addWithCarry x y c =
let
(# c1, r1 #) = plusWord2# x y
(# c2, r2 #) = plusWord2# r1 c
in
(# or# c1 c2, r2 #)
不幸的是,这会导致 x86 代码将进位位保存到寄存器中,然后将进位位本身相加,并将两个数字相加,从而导致每个字有 3 或 4 条指令,而不是 1 条。
所以我想知道如何组合 llvm.uadd.with.overflow
在 x86 上创建一系列 ADC 指令来实现多精度算术。如果我得到的 LLVM 代码可以产生高效的长加法,我希望可以将其转换回 Haskell 原始操作,以直接从 Haskell 代码产生高效的加法。
注释:
我当然可以使用 Haskell 的 FFI 来调用内联汇编或 GMP,但这会停止内联,并且我怀疑与小(即 <=256 位)操作数的内联代码相比相对较慢。
我发现“clang”有 __builtin_addc
,一种三参数加法的形式,不仅需要两个数字,还需要一个进位位,但 GHC 不通过 clang 编译,所以我不明白这有什么用。
最佳答案
这里正确的做法是确保您的 Haskell 前端使用 Clang 在使用其 __builtin_addc 时形成的相同模式来表示 LLVM IR 中的携带算术。
但是,今天不要指望这能用 LLVM 生成良好的代码。请参阅http://llvm.org/PR20748它记录了我们目前在 x86 上为这样的简单模式生成的绝对可怕的代码。但是一旦修复了该错误,您就应该获得所需的生成代码。
关于haskell - 使用 LLVM(来自 Haskell)的大数算术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33621832/
我正在尝试从 1 循环到 12,并为应用中特定 View 的更改网格输出一些跨度宽度。 $span-width: 8.21875%; $gap: 0.125%; @for $i from 1 thro
我试图在 Jekyll 的液体模板引擎中做一些基本的算术。我已经分配了一个变量 numColumns我试图在条件语句中使用它。 {% assign numColumns = 3 %} 注意我在下面的表
与 shift_left ieee.numeric_std 的功能, 我想将信号左移并插入 1或 0从右边。 signal qo: signed (3 downto 0) := (others=>'0
您在控制台中输入一些内容,例如(8+8)。然后程序会告诉你括号的插入是否正确。 这是我对错误括号的定义(当然还没有完成): () this means if one array element is
我有两个表(使用 PostgreSQL),它们看起来如下: 表1(p点从1到450递增1) --------+-------+--------+---------+---------+-------+
我正在编写一个任意精度的有理数包,我需要测试它的正确性和效率。当然,我可以自己组合一组临时测试,但由于我远不是第一个这样做的人,所以我认为值得一问:任何人都可以推荐我可以使用的现有测试集吗? 编辑:我
我最近一直在使用和学习 CSS3,并享受它的许多功能。现在我想知道是否可以设置一个有条件地分配 block 元素宽度的 CSS 规则。我所追求的那种东西 - 如果屏幕宽度小于 500 像素,则使用 3
我对这个实验中h的值有点疑惑。在 cpp 中, int h,J=3,n=200,p=3,h_m=(n+p+1)/2; float rt=(float)h_m/n; for(int j=0,j
算术+和按位或有什么区别吗?这有什么不同。 uint a = 10; uint b = 20; uint arithmeticresult = a + b; uint bitwiseOR = a |
我一直在尝试让算术 if 运算符起作用,但我似乎做不到。我是 C++ 的新手,仍在学习基础知识,但我只是想知道我是否正确使用了这个运算符。如果 x using namespace std; int
我在 VC++2010 中做过一些混合不同大小的操作数导致添加操作溢出的测试: int _tmain(int argc, _TCHAR* argv[]) { __int8 a=127;
#include int main(int argc,char *argv[]) { int i=10; void *k; k=&i; k++; printf("%p\n
在过去的 5 个小时里,我一直在寻找答案。尽管我找到了很多答案,但它们并没有以任何方式提供帮助。 我基本上要寻找的是任何 32 位无符号整数的按位异或运算符的数学、算术唯一表示。 尽管这听起来很简单,
结果是 127 double middle = 255 / 2 虽然这产生了 127.5 Double middle = 255 / 2 同时这也会产生 127.5 double middle = (
我在 Java 1.7 中有以下代码: DateFormat df = DateFormat.getInstance(); Date startDate = df.parse("07/28/12 01
此查询有效,没有错误 select add_months(date '2011-01-31', 1) from dual; ,而这个: select date '2011-01-31' + inter
理论上来说,如果我有一个无序项目列表 Link1 Link1 我如何使用 jQuery 执行以下操作? 1) 找到每个单独a元素的宽度 2) 找到每个单独的 li 元素的宽度 3)
想法如下:假设我有一个列表 P = [(1,0),(4,3)] 或类似的列表。我想以以下方式计算此列表定义的多项式:1X^0 + 4X^3。 为此,我编写了以下内容: evaluate(P,X,Y)
我正在从 mysql 数据库中提取数据。我想添加多次运行的长度,并按照跑得最远的人的排名对它们进行排序。 function determineLength($db, $name){
当尝试执行一个简单的 bash 脚本以将前面带有 0 的数字递增 1 时,原始数字被错误地解释。 #!/bin/bash number=0026 echo $number echo $((number
我是一名优秀的程序员,十分优秀!