- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
虽然我有一个很好的 LSFR C 实现,但我想我会在 Haskell 中尝试同样的方法——只是为了看看它是如何进行的。到目前为止,我想出的比 C 实现慢两个数量级,这就引出了一个问题:如何提高性能? 显然,位摆弄操作是瓶颈,分析器证实了这一点。
这是使用列表和 Data.Bits
的基线 Haskell 代码:
import Control.Monad (when)
import Data.Bits (Bits, shift, testBit, xor, (.&.), (.|.))
import System.Environment (getArgs)
import System.Exit (exitFailure, exitSuccess)
tap :: [[Int]]
tap = [
[], [], [], [3, 2],
[4, 3], [5, 3], [6, 5], [7, 6],
[8, 6, 5, 4], [9, 5], [10, 7], [11, 9],
[12, 6, 4, 1], [13, 4, 3, 1], [14, 5, 3, 1], [15, 14],
[16,15,13,4], [17, 14], [18, 11], [19, 6, 2, 1],
[20, 17], [21, 19], [22, 21], [23, 18],
[24,23,22,17], [25, 22], [26, 6, 2, 1], [27, 5, 2, 1],
[28, 25], [29, 27], [30, 6, 4, 1], [31, 28],
[32,22,2,1], [33,20], [34,27,2,1], [35,33],
[36,25], [37,5,4,3,2,1],[38,6,5,1], [39,35],
[40,38,21,19], [41,38], [42,41,20,19], [43,42,38,37],
[44,43,18,17], [45,44,42,41], [46,45,26,25], [47,42],
[48,47,21,20], [49,40], [50,49,24,23], [51,50,36,35],
[52,49], [53,52,38,37], [54,53,18,17], [55,31],
[56,55,35,34], [57,50], [58,39], [59,58,38,37],
[60,59], [61,60,46,45], [62,61,6,5], [63,62] ]
xor' :: [Bool] -> Bool
xor' = foldr xor False
mask :: (Num a, Bits a) => Int -> a
mask len = shift 1 len - 1
advance :: Int -> [Int] -> Int -> Int
advance len tap lfsr
| d0 = shifted
| otherwise = shifted .|. 1
where
shifted = shift lfsr 1 .&. mask len
d0 = xor' $ map (testBit lfsr) tap'
tap' = map (subtract 1) tap
main :: IO ()
main = do
args <- getArgs
when (null args) $ fail "Usage: lsfr <number-of-bits>"
let len = read $ head args
when (len < 8) $ fail "No need for LFSR"
let out = last $ take (shift 1 len) $ iterate (advance len (tap!!len)) 0
if out == 0 then do
putStr "OK\n"
exitSuccess
else do
putStr "FAIL\n"
exitFailure
tap :: [[Int]]
对于任何给定的位长度都是最大长度。 (更准确地说,它只是检查 LSFR 在 2n 次迭代后是否达到初始状态(零)。)
d0 = xor' $ map (testBit lfsr) tap'
.
Data.Array
: 尝试放弃,因为没有 foldl/r Data.Vector
: 比基线略快-O2
,
LTS Haskell 8.12 (GHC-8.0.2)
.
-O2 -fllvm
),执行时间下降到 1.7s-O2 -fllvm -optlc -mcpu=native
将此时间缩短至 0.73 秒 iterate
与 iterate'
当使用 Thomas 的代码(使用默认的“ native ”后端和 LLVM)时,@cirdec 的代码没有任何区别。但是,使用基线代码时确实会有所不同。 brew
安装此版本然后符号链接(symbolic link)
opt
和
llc
.见
7.10. GHC Backends .
最佳答案
前期事项
对于初学者,我在 Intel I5 ~2.5GHz、linux x86-64 上使用 GHC 8.0.1。
初稿:哦不!减速!
带有参数 25 的起始代码运行:
% ghc -O2 orig.hs && time ./orig 25
[1 of 1] Compiling Main ( orig.hs, orig.o )
Linking orig ...
OK
./orig 25 7.25s user 0.50s system 99% cpu 7.748 total
shift
在高性能代码中。 Shift 支持左移和右移,为此它需要一个分支。让我们用 2 等更具可读性的幂来杀死它(
shift 1 x
~>
2^x
和
shift x 1
~>
2*x
):
% ghc -O2 noShift.hs && time ./noShift 25
[1 of 1] Compiling Main ( noShift.hs, noShift.o )
Linking noShift ...
OK
./noShift 25 0.64s user 0.00s system 99% cpu 0.637 total
testBit lsfr 24 `xor` testBit lsfr 21
),但我们需要更通用的快速解决方案。
Int
传递给
advance
而不是整个列表。 popcount 指令需要良好的汇编生成,这需要 llvm 和可能
-optlc-mcpu=native
或另一个非悲观的指令集选择。
pc
以下。我已经放弃了
advance
的防护移除评论中提到:
let tp = sum $ map ((2^) . subtract 1) (tap !! len)
pc lfsr = fromEnum (even (popCount (lfsr .&. tp)))
mask = 2^len - 1
advance' :: Int -> Int
advance' lfsr = (2*lfsr .&. mask) .|. pc lfsr
out :: Int
out = last $ take (2^len) $ iterate advance' 0
% ghc -O2 so.hs -fforce-recomp -fllvm -optlc-mcpu=native && time ./so 25
[1 of 1] Compiling Main ( so.hs, so.o )
Linking so ...
OK
./so 25 0.06s user 0.00s system 96% cpu 0.067 total
g++ -O3
) 和 0.12 (
clang++ -O3 -march=native
) 秒,所以看起来我们已经超越了我们的标记。
关于haskell - LFSR 实现中的高效位摆弄,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43601927/
我在为我的序列(模式)获取正确的 LFSR 时遇到了一些问题,当我将它实现为 LFSR 和相应的抽头时,它不会生成序列,有什么建议吗?目标 patt 为 {1, 1, 0, 0, 0, 0, 1, 0
虽然我有一个很好的 LSFR C 实现,但我想我会在 Haskell 中尝试同样的方法——只是为了看看它是如何进行的。到目前为止,我想出的比 C 实现慢两个数量级,这就引出了一个问题:如何提高性能?
如上所述,我创建了一个 LFSR 来尝试生成一些数字,但它无法正常工作。 以此开始: unsigned int lfsr = 0x000001 while(1) { lfsr >>= 1 un
我知道,如果您抽取线性反馈移位寄存器生成的系列,您会得到一个新系列和一个新多项式。例如,如果您对由多项式 x4+x+1 的 LFSR 生成的系列中的每五个元素进行采样,您将获得由 x2+x+1 生成的
我试图了解如何更改伽罗瓦 LFSR 代码,以便能够将输出位数指定为下面提到的函数的参数。我的意思是我需要返回的不是 LFSR 的最后一位作为输出位,而是 LFSR 的任何位(例如第二位或第三位)。我真
我有使用从互联网上获得的左反馈移位寄存器生成随机数的代码: #define POLY_MASK_32 0xB4BCD35C #define POLY_MASK_31 0x7A5BC2E3 #inclu
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎离题,因为它缺乏足够的信息来诊断问题。 更详细地描述您的问题或include a minim
我想了解 galois LFSR 代码的工作原理。在维基百科页面上有一个带有示例的图。有一段 C 代码。 #include uint16_t lfsr = 0xACE1u; unsigned per
存在一个数学问题,就是生成n个唯一随机数序列的问题(随机数是N { 0, ..., n }的元素,(类似排列,但不占用内存) 最近我有点解决了这个问题,我确实得到了一些结果(阅读下面的内容,没有使用形
我正在努力学习如何 right >>和 left #include #include using namespace std; int main() { string seed;
使用线性反馈移位寄存器(LFSR)实现CRC生成有两种方法,如图所示。图中生成多项式的系数为100111,红色“+”圆圈为异或运算符。两者的初始化寄存器值都是 00000。 例如,如果输入数据比特流是
我正在为一个 OFDM 系统编程,包括发射器和接收器端。比特进入的第一个函数是扰码器,它基本上是一个 LFSR,我的多项式是 x^7 + x^4 + 1,简单地说,我对寄存器中的第 7 位和第 4 位
我最近开始为学校做一个 FPGA 项目,我之前从未使用过 VHDL,所以我尽力将我的程序拼凑在一起。总的来说,我的目标是让 prbs 或 LFSR 随机生成。我的 vhdl 代码在 xilinx IS
我在 C 中实现了 CRC32 算法,但经过数小时的查看并尝试修复它,它仍然无法正常工作。它可以编译,但校验和与几个在线 CRC 计算器中的校验和不同。我怀疑错误出在“if (0 != (charac
根据Linear feedback shift register维基百科上的页面, 除了 Galois LFSR 对计算机更友好之外,您能说出使用伽罗瓦数列相对于斐波那契数列的真正优势是什么吗? 换句
我想知道是否有一种方法可以结合两个概念:LFSR 和 Barrel Shifters 我正在寻找一种方法,在 O(1) 时间内将 LFSR 循环移动给定的移动次数。 我希望找到的是一个简单的过程,其中
我是一名优秀的程序员,十分优秀!