- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我为一个编程问题提交的两份报告仅在一个表达式上有所不同(其中 anchors
是一个非空列表,(getIntegrals n)
是一个状态单子(monad)):
Submission 1 . replicateM (length anchors - 1) (getIntegrals n)
Submission 2 . sequenceA $ const (getIntegrals n) <$> tail anchors
我猜这两个表达式的等价性在编译时应该很容易看出。然而,comparatively sequenceA
一个更慢,更重要的是,占用 >10 倍的内存:
代码
时间
内存
复制M一
732 毫秒
22200 KB
序列一个
1435 毫秒
262100 KB
(第二个条目出现“测试 4 超出内存限制”错误,因此情况可能更糟)。
为什么会这样?
很难预测哪些优化是自动的,哪些不是!
编辑:按照建议,粘贴 Submission 1下面的代码。在这个交互式问题中,“服务器”有一个大小为 n
的隐藏树。 .我们的代码的工作是找出那棵树,使用最少量的 ? k
形式的查询。 .粗略地说,服务器对 ? k
的响应是节点 k
对应的行在树的邻接距离矩阵中。我们的选择k
是:最初 1
,然后从 getAnchors
获得一堆节点.
{-# LANGUAGE Safe #-}
{-# OPTIONS_GHC -O2 #-}
import Data.Maybe
import qualified Data.ByteString.Lazy.Char8 as B8
import qualified Data.ByteString.Builder as Bu
import Data.Functor.Identity
import Control.Monad.Trans.State
import Control.Monad
import Control.Applicative
import Data.ByteString.Builder.Extra (flush)
import System.IO
type St = StateT [B8.ByteString] Identity
solve :: St Bu.Builder
solve = do
n <- getIntegral
ds <- getIntegrals n -- get the first row of adjacency matrix
let
anchors = getAnchors ds
readFirst = if head anchors==1 then return ds else getIntegrals n
readRest = replicateM (length anchors - 1) (getIntegrals n) -- get some other rows too
adjss <- liftA2 (:) readFirst readRest
let
adj1ss = [map snd $ filter ((1==).fst) (zip adjs [1..]) | adjs <- adjss]
s0 = Bu.string7
snl = Bu.string7 "\n" <> flush
i0 = Bu.intDec
printEdge src dst = i0 src <> s0 " " <> i0 dst <> snl
printAdj (src,dsts) = mconcat [printEdge src dst | dst<-dsts]
printAdjs = mconcat $ printAdj <$> zip anchors adj1ss
ask k = s0 "? " <> i0 k <> snl
askRest = mconcat $ ask <$> (dropWhile (==1) anchors)
return $ ask 1 <> askRest <> s0 "!" <> snl <> printAdjs
getAnchors :: [Int]->[Int]
getAnchors xs = reverse $ go (zip xs [1..]) [] [] where
go [] odds evens = if length odds < length evens then odds else evens
go ((k,i):rest) odds evens
| even k = go rest odds (i: evens)
| odd k = go rest (i: odds) evens
getByteString :: St B8.ByteString
getByteString = state getNext where
getNext [] = (B8.take 0 (B8.pack "."),[])
getNext (w:ws) = (w,ws)
getIntegral :: Num t => St t
getIntegral = convertToNum <$> getByteString where
convertToNum x = fromIntegral $ fromMaybe 0 $ liftA fst $ B8.readInteger x
getIntegrals :: Num t => Int -> St [t]
getIntegrals n = replicateM n getIntegral
main :: IO ()
main = do
hSetBuffering stdout NoBuffering
bytestrings <- B8.words <$> B8.getContents
B8.putStr $ Bu.toLazyByteString $ evalState solve bytestrings
最佳答案
这里的问题与内联有关。我不完全理解它,但这是我理解的。
内联
首先我们发现复制粘贴definition of replicateM
进入提交 1 会产生与提交 2 (submission) 相同的糟糕性能。但是,如果我们替换 INLINABLE
replicateM
的编译指示与 NOINLINE
pragma 事情再次起作用( submission )。INLINABLE
编译指示 replicateM
不同于 INLINE
pragma,后者导致比前者更多的内联。具体来说,如果我们定义 replicateM
在同一个文件中,用于内联的 Haskells 启发式决定内联,但使用 replicateM
在这种情况下,即使存在 INLINABLE
,它也从基础决定反对内联。语用。sequenceA
和 traverse
另一方面,两者都有 INLINE
导致内联的编译指示。从上述实验中得到提示,我们可以定义一个不可内联的 sequenceA
并且这确实使解决方案 2 起作用( submission )。
{-# NOINLINE sequenceA' #-}
sequenceA' :: [St x] -> St [x]
sequenceA' = sequenceA
出了什么问题?
readRest = replicateM (length anchors - 1) (getIntegrals n)
现在有趣的是,在内联代码中,黄色突出显示的行在
replicateM
的每个循环中运行。 ,而在非内联部分,它们只计算一次,在传递给
replicateM
的 lambda 抽象之外。 .
ds
在核心,但这个是指这个:
solve = do
n <- getIntegral
所以我认为正在发生的是,而不是运行
getIntegral
一次并保存结果,它的起始状态被保存,并且在循环的每一次通过时都以该状态重新运行。确实将此行更改为以下内容(需要 BangPatterns 语言扩展)修复了所有版本(
submission )。
solve = do
!n <- getIntegral
我仍然不确定,但这是我最好的猜测。
getContents
并懒惰地强制它,同时确保在强制太多之前提供输出。相反,明确地逐行读取输入会更安全。 IE。替换
StateT [ByteString]
与
IO
或者更花哨的东西,比如
Conduit
或
Pipe
.
关于performance - 为什么 replicateM (length xs) m 比 sequenceA (fmap (const m) xs) 更有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69883964/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!