algorithm - Haskell:优化图形处理算法-6ren

algorithm - Haskell:优化图形处理算法

转载作者：塔克拉玛干更新时间：2023-11-03 03:01:39

24

4

这是对 this post 的跟进, 代码现在基于 Structuring Depth-First Search Algorithms in Haskell to do depth first search ，由 King 和 Launchbury 在 1990 年代创作。该论文提出了一种生成和修剪策略，但使用了带有 State Monad 的可变数组(我怀疑某些语法已被弃用)。作者暗示集合可用于记住访问过的节点，作为额外 O(log n) 的成本。我尝试用一个集合来实现(我们现在拥有比 1990 年代更好的机器!)，使用现代 State Monad 语法，并使用 Vectors 而不是数组(正如我读到的那样通常更好)。

和以前一样，我的代码在小型数据集上运行，但无法返回我需要分析的 5m 边图，我正在寻找关于大规模运行的弱点的提示 .我所知道的是代码可以在内存中轻松运行，所以这不是问题，但我是否无意中滑到了 O(n2)？ (相比之下，这篇论文在 Data.Graph 库(我最近也从中借用了一些代码)中的官方实现使用了一个可变数组，但在大数据集上失败了……堆栈溢出!!!)

所以现在我有一个带有未完成的 IntSet 状态的 Vector 数据存储和一个带有崩溃的 ST Monad 数组“官方”数组! Haskell 应该能够做得比这更好？

import Data.Vector (Vector)
import qualified Data.IntSet as IS
import qualified Data.Vector as V
import qualified Data.ByteString.Char8 as BS
import Control.Monad.State

type Vertex   = Int
type Table a  = Vector a
type Graph    = Table [Vertex]
type Edge     = (Vertex, Vertex)
data Tree a   = Node a (Forest a) deriving (Show,Eq)
type Forest a = [Tree a]
-- ghc -O2 -threaded --make
-- +RTS -Nx
generate :: Graph -> Vertex -> Tree Vertex
generate g v = Node v $ map (generate g) (g V.! v)

chop :: Forest Vertex -> State IS.IntSet (Forest Vertex)
chop [] = return []
chop (Node x ts:us) = do
    visited <- contains x
    if visited then
        chop us
    else do
        include x
        x1 <- chop ts
        x2 <- chop us
        return (Node x x1:x2)

prune :: Forest Vertex -> State IS.IntSet (Forest Vertex)
prune vs = chop vs

main = do
    --edges <- V.fromList `fmap` getEdges "testdata.txt"
    edges <- V.fromList `fmap` getEdges "SCC.txt"
    let 
        -- calculate size of five largest SCC
        maxIndex = fst $ V.last edges
        gr = buildG maxIndex edges
        sccRes = scc gr
        big5 = take 5 sccRes
        big5' = map (\l -> length $ postorder l) big5
    putStrLn $ show $ big5'

contains :: Vertex -> State IS.IntSet Bool
contains v = state $ \visited -> (v `IS.member` visited, visited)

include :: Vertex -> State IS.IntSet ()
include v = state $ \visited -> ((), IS.insert v visited)


getEdges :: String -> IO [Edge]
getEdges path = do
    lines <- (map BS.words . BS.lines) `fmap` BS.readFile path
    let pairs = (map . map) (maybe (error "can't read Int") fst . BS.readInt) lines
    return [(a, b) | [a, b] <- pairs] 

vertices :: Graph -> [Vertex]
vertices gr = [1.. (V.length gr - 1)]

edges :: Graph -> [Edge]
edges g = [(u,v) | u <- vertices g, v <- g V.! u]

-- accumulate :: (a -> b -> a)  -> Vector a-> Vector (Int, b)--> Vector a
-- accumulating function f
-- initial vector (of length m)
-- vector of index/value pairs (of length n)
buildG :: Int -> Table Edge -> Graph
buildG maxIndex edges = graph' where
    graph    = V.replicate (maxIndex + 1) []
    --graph'   = V.accumulate (\existing new -> new:existing) graph edges
    -- flip f takes its (first) two arguments in the reverse order of f
    graph'   = V.accumulate (flip (:)) graph edges

mapT :: Ord a => (Vertex -> a -> b) -> Table a -> Table b
mapT = V.imap

outDegree :: Graph -> Table Int
outDegree g = mapT numEdges g
    where numEdges v es = length es

indegree :: Graph -> Table Int
indegree g = outDegree $ transposeG g

transposeG :: Graph -> Graph
transposeG g = buildG (V.length g - 1) (reverseE g)

reverseE :: Graph -> Table Edge
reverseE g = V.fromList [(w, v) | (v,w) <- edges g]

-- --------------------------------------------------------------

postorder :: Tree a -> [a]
postorder (Node a ts) = postorderF ts ++ [a]

postorderF :: Forest a -> [a]
postorderF ts = concat (map postorder ts)

postOrd :: Graph -> [Vertex]
postOrd g = postorderF (dff g)

dfs :: Graph -> [Vertex] -> Forest Vertex
dfs g vs = map (generate g) vs

dfs' :: Graph -> [Vertex] -> Forest Vertex
dfs' g vs = fst $ runState (prune d) $ IS.fromList []
    where d = dfs g vs

dff :: Graph -> Forest Vertex
dff g = dfs' g $ reverse (vertices g)

scc :: Graph -> Forest Vertex
scc g = dfs' g $ reverse $ postOrd (transposeG g)

最佳答案

一些可能的小改进:

改变

type Edge = (Vertex, Vertex)

到

data Edge = Edge {-# UNPACK #-} !Vertex {-# UNPACK #-} !Vertex

重用每条边的内存使用，从 7 个字减少到 3 个字，并改进缓存局部性。减少内存压力几乎总是可以提高运行时间。正如 @jberryman 提到的，可以为 Table Edge 使用未装箱的向量(这样您就不需要上述自定义数据类型)。

generate :: Graph -> Vertex -> Tree Vertex
generate g v = Node v $ map (generate g) (g V.! v)

如果您确定索引在边界内，您可以使用 vector 中的不安全索引函数而不是 .!。

contains :: Vertex -> State IS.IntSet Bool
contains v = state $ \visited -> (v `IS.member` visited, visited)

改为使用 get 和 put $! 的组合。

include :: Vertex -> State IS.IntSet ()
include v = state $ \visited -> ((), IS.insert v visited)

改用modify'。

您在程序中使用了很多列表。链表不是内存/缓存效率最高的数据结构。看看您是否可以转换代码以使用更多向量。

关于algorithm - Haskell:优化图形处理算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24370976/

24

4

0

文章推荐： string - 后缀数组实现错误

文章推荐： java - 确保所有任务完成的同步对象

文章推荐： java - 检索带引号的字符串和引号字符的正则表达式

文章推荐：通过分组优化 Python 打包

latex - 如何正确插入图像/图形，并在 latex 中使文本 "flow around"成为图像/图形？
我一直在为此而苦苦挣扎。我想插入一个图像，并将其“靠近”讨论该图像的文本，但是该页面上的文本将围绕图像环绕/流动。我已将图像转换为eps格式。最初，我尝试使用图形环境(\begin {figure}
azure - 使用 Microsoft 图形 API 或 Azure AD 图形 api 从用户界面删除应用程序对用户的访问权限
我在用户界面中创建了管理控制台，管理员可以在其中执行所有操作，例如创建、删除用户、向用户分配应用程序以及从用户界面删除用户的应用程序访问权限我厌倦了使用 Microsoft 图形 API 和 Azu
azure - 使用 Microsoft 图形 API 或 Azure AD 图形 api 从用户界面删除应用程序对用户的访问权限
我在用户界面中创建了管理控制台，管理员可以在其中执行所有操作，例如创建、删除用户、向用户分配应用程序以及从用户界面删除用户的应用程序访问权限我厌倦了使用 Microsoft 图形 API 和 Azu
图形/视觉有趣的话题
我想为计算机图形学类(class)做一个有趣的项目。我知道那里有很多文献(即 SIGGRAPH session 论文)。我对计算机图形学(即图像处理、3D 建模、渲染、动画)兴趣广泛。但是，我只学了
JavaScript 图形
我试图在 MaterializeCSS 网站上创建一些类似于这个的图形，但我不知道它来自哪里，我查看了整个 MaterializeCSS 网站，它不是框架的一部分，我找不到在代码中他们使用的是什么我
安卓绘图/图形
我有一个包含 1 到 6 之间的各种数字的 TextView ，每个数字在每一行上代表一次，例如 123456 213456 214356 ...... 我希望能够绘制一条蓝线来跟随单个数值在列表中向
Cygwin 图形？
我目前在 Windows 7 上使用 Netbeans 和 Cygwin，我希望用 C 语言编写一个简单的 2D 游戏。我设法找到的大多数教程都使用 Turbo C 提供的 graphics.h，C
Python seaborn 图形
亲爱的，我正在尝试将 kaggle 教程代码应用于 Iris 数据集。不幸的是，当我执行图表的代码时，我只能看到这个输出而看不到任何图表: matplotlib.axes._subplots.Axe
performance - 图形:浮点累积图像的最佳性能
我需要加快我正在处理的一些粒子系统的视觉效果。令人眼前一亮的是添加混合、积累以及粒子上的轨迹和发光。目前我正在手动渲染到浮点图像缓冲区，在最后一分钟转换为无符号字符，然后上传到 OpenGL 纹理。为
networking - 生成图形的图片/图形
在研究跨网络的最短路径算法时，我想生成网络图片。我想代表节点(圆圈)、链接(线)、遍历链接的成本(链接线中间的数字)和链接的容量(链接线上它代表的节点旁边的数字)在这张图中。是否有任何库/软件可以帮助
Azure 图形 API
尽管我已将应用程序从库添加到 Azure AD，但我无法看到何时尝试提取数据。但我可以看到添加的自定义应用程序。就像我添加了 7 个应用程序一样； 2 个来自图库(Google 文档、一个驱动器)和
elasticsearch - 图形，文本和分析组合搜索
因此，我正在构建一个系统，该系统具有“人员”，“银行帐户”和“银行帐户交易”。我需要能够回答以下问题: “将所有与1/2/3度有联系的人归还给特定的人”， “返回年龄在40岁以上的所有人” “从德国
java JFrame 图形
我在 JFrame 构造函数中有以下简单代码 super(name); setBounds(0,0,1100,750); setLayout(null); setVis
java 图形 - 具有两种颜色的形状
(这是java)我有一个椭圆形，代表一个单位。我希望椭圆形的颜色代表单位的健康状况。因此，一个完全健康的单位将是全绿色的。随着单位生命值的降低，椭圆形开始从底部填充红色。因此，在 50% 生命值下，椭
Java 图形 JApplet
我目前正在开发一个学校项目。我们必须制作一个Applet，我选择了JApplet。由于某种原因，我用来显示特定字符串的面板将不会显示。这里可能有什么问题？请指出我正确的方向。另外，我看了一些教程，
java - 两行代码之间的延迟 - 图形
我正在尝试创建一个 Simon game 。我正在编写游戏程序，但遇到了问题。我希望程序从队列中读取游戏中之前存在的所有值，并以正确的顺序将它们的颜色变为闪烁(我选择将它们变为灰色，然后在第二秒后恢复
Java 图形、图形面板和按钮面板
我正在尝试创建一个框架，该框架在同一框架的顶部有一个图形面板(通过布局)，在其下方有一个按钮/标签面板。到目前为止，我似乎已经能够将它们放在同一个框架上，但与按钮/标签面板相比，图形面板非常小....
Java Swing 图形
我用 Java 编写了一个解决数独问题的代码，并使用 Java Applet 来设计它。现在，我尝试使用 Java Swing 使其看起来更好，并添加一些功能，例如“保存”数独板等。不幸的是，我对 J
Java 图形用户界面/图形
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
c - 图形(二维旋转)
我现在尝试了 8 个多小时来解决这个问题，但无法弄清楚，请帮助找出我的代码有什么问题。 int main() { int gd = DETECT, gm; float ANGLE =

首页

博学

6Ren·AI

商城

algorithm - Haskell:优化图形处理算法