- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是一名物理学家,最近我经常使用 Fortran。最初我广泛使用 Java 来娱乐,因为它是我学习的第一种语言,但我已经放弃了它,转而使用 Fortran 和 C++。我对素数有业余爱好,所以我创建了一个素数筛。我能够在 15 秒内找到最大为 2^31 的所有质数。这是 Java 的最大数组大小,所以到此结束。我小心地移植了代码(我的意思是小心,我很沮丧我的代码很慢而且我找不到错误,我将我的 Fortran 代码移植回 Java 以验证这不是我的错,然后将它移植回来Fortran,删除每次迭代!)。问题是大约 800,000,000 个 Fortran 将停止运行。到目前为止,它击败了 Java,但在那之后它非常慢。我花了几个小时绘制它并拟合曲线。它的速度呈指数级增长,可能需要数百年才能解决到 Java 级别。我问了很多人都没有用。为什么这会发生在我身上?!?!有没有聪明的 Fortran 编码员可以帮助我?我正在运行 2013 年末 i5 的 Macbook Pro。我的代码如下。
program sieve
integer(4),allocatable:: prime(:)
integer(4)::a,max,b,primeCount
write(*,*)"Welcome to the slow prime number sieve!"
write(*,*)"--------------------------------------------"
write(*,*)"Up to what numbers do you need to find primes for?"
write(*,*)"Enter a number below 2^(32-1)"
read*, max
primeCount=0
allocate(prime(max))
prime(1)=1
do a=2,int(sqrt(real(max))) !the main loop
if(prime(a)==0)then !if the number is marked as prime procede
do b=2*a,max,a !eliminate all the numbers that are multiples of the number
if(prime(b)==0)then !but only spend time eliminating if the number is still marked prime
prime(b)=1
end if
end do
end if
end do
do a=1,max
if(prime(a)==0)then
primeCount=primeCount+1
end if
end do
print*, primeCount
end program
最佳答案
我可以看到您可以采取一些措施来加速代码,尽管它们似乎都无法解释您遇到的性能急剧下降。最有可能的罪魁祸首似乎是 Alexander Vogt 所建议的 RAM 限制。
你应该做的第一件事是改变prime
来自 integer
至 logical
大批。这减少了内存需求并加快了 if (prime(a)==0)
的评估速度。 .
代码的相关部分将如下所示
logical(1),allocatable:: prime(:)
primeCount=0
allocate(prime(max))
prime = .false.
prime(1)=.true.
do a=2,int(sqrt(real(max))) !the main loop
if(.not. prime(a))then !if the number is marked as prime procede
do b=2*a,max,a !eliminate all the numbers that are multiples of the number
if(.not. prime(b))then !but only spend time eliminating if the number is still marked prime
prime(b)=.true.
end if
end do
end if
end do
do a=1,max
if(.not. prime(a))then
primeCount=primeCount+1
end if
end do
prime(1:max)=0
,我不会做任何 Java 编程,但会在 Matlab 中进行。然后只在
0
之间切换值和
1
我认为 Matlab 将数组视为
logical
大批。 Java 可能也在做同样的事情。这可以解释为什么您的 Java 代码不会受到性能下降的影响(假设 RAM 约束确实是问题所在)。
max=800 million (8E8)
用了 22 秒.
max=2E9
用了 60 秒.这不是问题中报告的小时数。同样在每种情况下
prime
数组恰好被初始化为零。
integer(1)
使程序运行速度比使用
integer(4)
快 33% .与
logical(1)
它的运行速度比
integer(1)
快不到 5% .这种行为可能是由于更好地使用现金作为
prime
的每个元素占用更少的内存空间,因此处理器可以对当前现金数据进行大量迭代,以更快的速度通过循环。
prime
的影响。正如 HighPerformanceMark 指出的那样,数组(尽管这绝对不应该发生)。此外,我怀疑 Java 声明了
prime
作为一个逻辑数组,这就是为什么没有出现问题的原因。 (尽管在 Java 中 15 秒内 2^31?这里使用的 Fortran 代码与此相去甚远。真的是比较相同的代码吗?)
关于performance - 当数组大于 800,000,000 时,我的 Fortran 筛选会显着减慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25007429/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!