- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试收集有关素数的一些统计数据,其中包括数字 (prime-1)/2 的因数分布。我知道有统一选择数的因子大小的通用公式,但我还没有看到任何关于小于一个素数的因子分布的信息。
我编写了一个程序,从 2^63 之后的第一个素数开始遍历素数,然后使用试除以 2^32 以内的所有素数对 (prime - 1)/2 进行因式分解。然而,这非常慢,因为要遍历大量素数(和大量内存)。我将每个质数存储为一个字节(通过存储从一个质数到下一个质数的增量)。我还对最大 2^64 的数字使用 Miller-Rabin 素数测试的确定性变体,因此我可以轻松检测剩余值(成功除法后)何时为素数。
我已经尝试使用 pollard-rho 和椭圆曲线分解的变体,但很难在试验除法和切换到这些更复杂的方法之间找到正确的平衡。此外,我不确定我是否正确实现了它们,因为有时它们似乎需要很长时间才能找到一个因素,并且根据它们的渐近行为,我希望它们对于这么小的数字会很快。
我还没有找到任何关于因式分解多个数字的信息(与仅仅尝试因式分解一个数字相比),但似乎应该有某种方法可以利用这一点来加快任务速度。
非常感谢关于此问题的任何建议、替代方法的指示或其他指导。
编辑:我存储素数的方式是存储下一个素数的 8 位偏移量,隐含的第一个素数为 3。因此,在我的算法中,我单独检查除以 2,然后开始循环:
factorCounts = collections.Counter()
while N % 2 == 0:
factorCounts[2] += 1
N //= 2
pp = 3
for gg in smallPrimeGaps:
if pp*pp > N:
break
if N % pp == 0:
while N % pp == 0:
factorCounts[pp] += 1
N //= pp
pp += gg
另外,我用轮筛算出试除素数,然后用几个素数取余的算法得到给定起点后的下一个素数。
我使用以下代码来测试给定数字是否为质数(现在将代码移植到 C++):
bool IsPrime(uint64_t n)
{
if(n < 341531)
return MillerRabinMulti(n, {9345883071009581737ull});
else if(n < 1050535501)
return MillerRabinMulti(n, {336781006125ull, 9639812373923155ull});
else if(n < 350269456337)
return MillerRabinMulti(n, {4230279247111683200ull, 14694767155120705706ull, 1664113952636775035ull});
else if(n < 55245642489451)
return MillerRabinMulti(n, {2ull, 141889084524735ull, 1199124725622454117, 11096072698276303650});
else if(n < 7999252175582851)
return MillerRabinMulti(n, {2ull, 4130806001517ull, 149795463772692060ull, 186635894390467037ull, 3967304179347715805ull});
else if(n < 585226005592931977)
return MillerRabinMulti(n, {2ull, 123635709730000ull, 9233062284813009ull, 43835965440333360ull, 761179012939631437ull, 1263739024124850375ull});
else
return MillerRabinMulti(n, {2ull, 325ull, 9375ull, 28178ull, 450775ull, 9780504ull, 1795265022ull});
}
最佳答案
我没有一个明确的答案,但我确实有一些观察和一些建议。
在 2^63 和 2^64 之间大约有 2*10^17 个素数,所以你写的任何程序都会运行一段时间。
让我们谈谈 2^63 到 2^64 范围内数字的素数测试。任何通用测试都会做比您需要的更多的工作,因此您可以通过编写专用测试来加快速度。我建议对基数 2 和基数 3 进行强伪素数测试(如 Miller-Rabin 中的测试)。如果这些测试中的任何一个显示数字是合数,那么你就完成了。否则,在以 2 和 3 为底的强伪质数表中查找数字(二分搜索)(请 Google 为您查找这些表)。两个强伪素数测试后跟一个表查找肯定会比您当前执行的确定性 Miller-Rabin 测试更快,后者可能使用六个或七个碱基。
对于因式分解,尝试除法到 1000,然后是 Brent-Rho,直到已知质因数的乘积超过被分解数的立方根应该相当快,几毫秒。那么,如果剩下的余因子是复合的,它必然只有两个因子,所以 SQUFOF 将是一个很好的拆分它们的算法,比其他方法更快,因为所有算术都是用小于数字平方根的数字完成的因式分解,在您的情况下,这意味着可以使用 32 位算术而不是 64 位算术来完成因式分解,因此它应该很快。
代替因式分解和素性测试,更好的方法是使用埃拉托色尼筛法的变体来因式分解大块数字。这仍然会很慢,因为有 2.03 亿个筛选质数小于 2^32,并且您将需要处理分段筛的簿记,但考虑到您一次分解大量数字,这可能是最好的方法你的任务。
我在 my blog 有上述所有内容的代码.
关于python - Factor (Prime-1)/2 for 64-bit Prime 的最快方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40109623/
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我想将引用保留为 Factor 中元组的成员。但是,当我尝试对其执行“调用”时,出现错误“无法将调用应用于运行时计算值”。请注意,将函数标记为“内联”不会执行任何操作。 示例代码: USING: ac
我最近看到 Matt Dowle 用 as.factor() 写了一些代码, 具体来说 for (col in names_factors) set(dt, j=col, value=as.facto
(所描述的行为是一个错误!) 我不明白 group_by 对作为因素的列和不是因素的列的影响。下面分析这两种可能性: library(dplyr) df % group_by(height) %>%
有没有人用 Factor 构建了一个 Web 应用程序? ?您在此过程中遇到了哪些绊脚石或问题? 最佳答案 试试 this . 关于factor-lang - 使用 Factor 构建 Web 应用程
例如,如果 CPU 有四个内核和八个内核线程。 我应该设置 核心池大小因子 一直设置到8? 的一般尺寸是多少?最大池大小因子 关于 核心池大小因子 ? 我提到的其他设置是否与 Akka 配置相关? 最
我正在尝试通过重新创建给我的数据结果来在 R 中实现 NB 分类器。现在我只是对训练数据本身进行测试,看看准确性如何。 数据集中有 29 个变量,其中一个称为“状态”。它有两个值:Win 和 Lose
当一个可被另一个整除时,数字的位之间是否存在任何关系? 36位与9位或4位或12位、10位(1010)与5位(101)、21位(10101)与7位(00111)的位序列有什么关系? 谢谢。如果有些句子
我学会了一种叫做“线性筛”的算法https://cp-algorithms.com/algebra/prime-sieve-linear.html能够在线性时间内得到所有小于 N 的素数。 这个算法有
我正在使用 R 中的一个数据集,它带有一个代码本,它基本上告诉我因子变量的不同级别的标签应该是什么。例如,使用密码本,我可以看到在我的“性别”变量中,0 是“女性”,1 是“男性”。我正在使用此信息相
我试图将数据集分成具有因子变量和非因子变量的部分。 我正在做类似的事情: 这部分工作: factorCols <- sapply(df1, is.factor) factorDf <- df1[,fa
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
我现在正在自学 R。我正在尝试使用以下内容将整数变量转换为分类变量。 train[, c("Store", "DayOfWeek")] str(mtcars) 'data.frame': 32
我正在玩 Factor,试图对串联编程有一点了解。写一个词来平方一个数字是微不足道的: : square ( n -- n ) dup * ; 但对于我来说,我似乎无法弄清楚如何计算一个数字的立方:
给定一个数 x,我如何找到两个数 y 和 z,这样 x = y * z 和 y==Z 或者 y 和 z 彼此接近?此外,x、y、z 都是整数。 示例: x = 16484, y=z=128; x=
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 3 年前。 Improve this ques
如果你觉得这听起来很傻,我提前道歉,我是 splunk 的新手,并且学过 udemy 类(class),但无法弄清楚这一点。 If I check my indexes.conf file in cl
为什么此代码:as.factor(c("\U201C", '"3', "1", "2", "\U00B5")),在每个操作系统上返回因子级别的不同顺序? 在Linux上: > as.factor(c(
我是一名优秀的程序员,十分优秀!