Haskell 向量 C++ push_back 类比-6ren

Haskell 向量 C++ push_back 类比

转载作者：行者123 更新时间：2023-12-03 22:32:47

25

4

我发现 Haskell Data.Vector.*错过 C++ std::vector::push_back的功能。有grow/unsafeGrow ，但它们似乎具有 O(n) 复杂度。

有没有办法在一个元素的 O(1) 摊销时间内增长向量？

最佳答案

不，Data.Vector 中真的没有这样的设施。 .使用 MutableArray 从头开始实现这一点并不难喜欢 Data.Vector.Mutable确实(见下面我的实现)，但有一些明显的缺点。特别是，它的所有操作最终都发生在一些状态上下文中，通常是 ST。或 IO .这有以下缺点

任何操作这种数据结构的代码最终都必须是一元的

编译器不太可能进行优化。例如，像 vector 这样的库使用一个非常聪明的东西，叫做 fusion优化中间分配。这种事情在状态上下文中是不可能的。

并行性将变得更加困难:在 ST我什至不能有两个线程和 IO我将在所有地方都有比赛条件。这里令人讨厌的一点是，任何共享都必须在 IO 中进行。 .

好像这一切还不够，垃圾收集在纯代码中也表现得更好。

那我该怎么办？

您并不经常需要这种行为 - 通常您最好使用不可变的数据结构(从而避免所有上述问题)，它会做类似的事情。仅限于 containers GHC 附带的一些替代方案包括:

如果您几乎总是只使用 push_back ，也许你只想要一个堆栈(一个普通的旧 [a] )。

如果您期望做更多 push_back比查找， Data.Sequence 给你O(1)附加到任一端和 O(log n)抬头。

如果您对很多操作感兴趣，尤其是类似 hashmap 的操作， Data.IntMap 非常优化。即使这些操作的理论成本是 O(log n) ，你需要一个相当大的IntMap开始感受这些成本。

制作类似 C++ vector 的东西

当然，如果一个人不关心最初提到的限制，那么没有理由不拥有类似 C++ 的向量。只是为了好玩，我从头开始实现了这个(需要包 data-default 和 primitive )。

这段代码可能不在某些库中的原因是它违背了 Haskell 的大部分精神(我这样做是为了符合 C++ 样式向量)。

唯一真正产生新向量的操作是newVector。 - 其他一切都“修改”现有向量。由于pushBack不返回新的 GrowVector ，它必须修改现有的(包括它的长度和/或容量)，所以length和 capacity必须是“指针”。反过来，这意味着即使获得 length是一元操作。

虽然这不是拆箱，但复制 vector 不会太困难小号 data family approach - 这只是乏味1。

照这样说:

module GrowVector (
  GrowVector, newEmpty, size, read, write, pushBack, popBack
) where 

import Data.Primitive.Array
import Data.Primitive.MutVar
import Data.Default
import Control.Monad
import Control.Monad.Primitive (PrimState, PrimMonad)
import Prelude hiding (length, read)

data GrowVector s a = GrowVector
  { underlying :: MutVar s (MutableArray s a) -- ^ underlying array
  , length :: MutVar s Int                    -- ^ perceived length of vector
  , capacity :: MutVar s Int                  -- ^ actual capacity
  }

type GrowVectorIO = GrowVector (PrimState IO)

-- | Make a new empty vector with the given capacity. O(n)
newEmpty :: (Default a, PrimMonad m) => Int -> m (GrowVector (PrimState m) a)
newEmpty cap = do
  arr <- newArray cap def
  GrowVector <$> newMutVar arr <*> newMutVar 0 <*> newMutVar cap

-- | Read an element in the vector (unchecked). O(1)
read :: PrimMonad m => GrowVector (PrimState m) a -> Int -> m a
g `read` i = do arr <- readMutVar (underlying g); arr `readArray` i

-- | Find the size of the vector. O(1)
size :: PrimMonad m => GrowVector (PrimState m) a -> m Int
size g = readMutVar (length g)

-- | Double the vector capacity. O(n)
resize :: (Default a, PrimMonad m) => GrowVector (PrimState m) a -> m ()
resize g = do
  curCap <- readMutVar (capacity g)         -- read current capacity
  curArr <- readMutVar (underlying g)       -- read current array
  curLen <- readMutVar (length g)           -- read current length
  newArr <- newArray (2 * curCap) def       -- allocate a new array twice as big
  copyMutableArray newArr 1 curArr 1 curLen -- copy the old array over
  underlying g `writeMutVar` newArr         -- use the new array in the vector
  capacity g `modifyMutVar'` (*2)           -- update the capacity in the vector

-- | Write an element to the array (unchecked). O(1)
write :: PrimMonad m => GrowVector (PrimState m) a -> Int -> a  -> m ()
write g i x = do arr <- readMutVar (underlying g); writeArray arr i x

-- | Pop an element of the vector, mutating it (unchecked). O(1)
popBack :: PrimMonad m => GrowVector (PrimState m) a -> m a
popBack g = do
  s <- size g;
  x <- g `read` (s - 1)
  length g `modifyMutVar'` (+ negate 1)
  pure x

-- | Push an element. (Amortized) O(1)
pushBack :: (Default a, PrimMonad m) => GrowVector (PrimState m) a -> a -> m ()
pushBack g x = do
  s <- readMutVar (length g)                -- read current size
  c <- readMutVar (capacity g)              -- read current capacity
  when (s+1 == c) (resize g)                -- if need be, resize
  write g (s+1) x                           -- write to the back of the array
  length g `modifyMutVar'` (+1)             -- increase te length

grow 的当前语义

我认为 github issue在解释语义方面做得很好:

I think the intended semantics are that it may do a realloc, but not guaranteed to, and all the current implementations do the simpler copying semantics because for on heap allocations the cost should be roughly the same.

基本上你应该使用 grow当您想要一个增加大小的新可变向量时，从旧向量的元素开始(不再关心旧向量)。这非常有用 - 例如可以实现 GrowVector使用 MVector和 grow .

1 方法是，对于您想要拥有的每种新类型的未装箱矢量，您制作一个 data instance将您的类型“扩展”为固定数量的未装箱数组(或其他未装箱向量)。这是 data family 的重点- 允许一个类型的不同实例具有完全不同的运行时表示，并且也是可扩展的(如果需要，您可以添加自己的 data instance)。

关于Haskell 向量 C++ push_back 类比，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31598273/

25

4

0

文章推荐： svg - 从 Sketch 导出 SVG 时尺寸错误

文章推荐： python - 在 Tkinter 中获取默认字体

python - 向量 * 向量(矩阵乘法)
我想用一个向量执行以下操作。 a = np.array(np.arange(0, 4, 1)) 我想得到一个乘法，结果是一个矩阵 | 0 1 2 3 4 -| - - - - - - - 0
R:gsub，模式=向量，替换=向量
正如标题所述，我正在尝试使用 gsub，其中我使用向量作为“模式”和“替换”。目前，我的代码如下所示: names(x1) names(x1) [1] "2110023264A.Ms.Amp
python - 将 numpy (n,) 向量 reshape 为 (n,1) 向量
所以当我需要做一些线性代数时，我更容易将向量视为列向量。因此，我更喜欢 (n,1) 这样的形状。形状 (n,) 和 (n,1) 之间是否存在显着的内存使用差异？什么是首选方式？以及如何将 (n,
r - 为什么 seq() 同时创建 int 和 num 向量，而 c() 从不创建 int 向量？
我不明白为什么 seq() 可以根据元素中是否存在小数点输出不同的类，而 c() 总是创建一个 num向量，无论是否存在小数。例如: seqDec <- seq(1, 2, 0.5) # num v
机器学习的数学基础--向量，矩阵
机器学习与传统编程的一个重要区别在于机器学习比传统编程涉及了更多的数学知识。不过，随着机器学习的飞速发展，各种框架应运而生，在数据分析等应用中使用机器学习时，使用现成的库和框架成为常态，似乎越来越不需
chisel - RegEnable 向量
寻找有关如何将 RegEnable 用作向量的示例/建议。此外，我想控制输入和使能信号成为 Vector 中寄存器索引的函数。首先，我如何声明 RegEnable() 的 Vector，其次如何迭代
r - 将分配函数应用于所需变量名称的列表/向量
假设我有一个包含变量名称的向量 v1，我想为每个变量分配一个值(存储在单独的向量中)。我如何在没有迭代的情况下做到这一点？ v1 <- c("a","b","c") v2 <- c(1,2,3) 我想
arrays - 向量、矩阵和数组数据类型之间有什么区别？
R 提供了三种类型来存储同质对象列表:向量、矩阵和数组。据我所知: 向量是一维数组的特殊情况矩阵是二维数组的特例数组还可以具有任意维度级别(包括 1 和 2)。在向量上使用一维数组和在矩阵上
python - 向量、矩阵乘法和求和
我正在绕着numpy/scipy中的所有选项转圈。点积、乘法、matmul、tensordot、einsum 等我想将一维向量与二维矩阵(这将是稀疏csr)相乘并对结果求和，这样我就有了一个一维向量
python - 向量-向量乘法创建矩阵
我是一个 IDL 用户，正在慢慢切换到 numpy/scipy，并且有一个操作我在 IDL 中非常经常做，但无法用 numpy 重现: IDL> a = [2., 4] IDL> b = [3., 5
python向量*向量------>矩阵
在python计算机图形工具包中，有一个vec3类型用于表示三分量向量，但是我如何进行以下乘法: 三分量向量乘以其转置结果得到 3*3 矩阵，如下例所示: a = vec3(1,1,1) matrix
javascript - 向量，以最大速度计算运动力
我正在构建一款小型太空射击游戏。当涉及到空间物理学时，我曾经遇到过数学问题。用文字描述如下:有一个最大速度。因此，如果您全速行驶，您的飞船将在屏幕上一遍又一遍地移动，就像在旧的小行星游戏中一样。如果
Python 断言 isinstance() 向量
我正在尝试在 python 中实现 Vector3 类。如果我用 c++ 或 c# 编写 Vector3 类，我会将 X、Y 和 Z 成员存储为 float ，但在 python 中，我读到鸭式是要走
scala - 将本地向量转换为 RDD[向量]
我是 Spark 和 Scala 的新手，我正在尝试阅读有关 MLlib 的文档。 http://spark.apache.org/docs/1.4.0/mllib-data-types.html上的
r - 比较 boolean 向量
我有一个包含四个逻辑向量的数据框， v1 , v2 , v3 , v4 是对还是错。我需要根据 boolean 向量的组合对数据帧的每一行进行分类(例如， "None" , "v1 only" , "
r - 如何将散点图中每个点的垂线下降到(特征)向量？
我正在创建一个可视化来说明主成分分析的工作原理，方法是绘制一些实际数据的特征值(为了说明的目的，我将子集化为二维)。我想要来自 this fantastic PCA tutorial 的这两个图的组
r - 如何修剪 R 向量？
我有以下排序向量: > v [1] -1 0 1 2 4 5 2 3 4 5 7 8 5 6 7 8 10 11 如何在不遍历整个向量的情况下删除 -1、0 和 11
r - R 中的基于零的数组/向量
有什么方法可以让 R 对向量和其他序列数据结构使用基于零的索引，例如在 C 和 python 中。我们有一些代码在 C 中进行一些数值处理，我们正在考虑将其移植到 R 中以利用其先进的统计功能，但是
clojure - 解构 map 向量
我有一个函数可以查询我的数据库中最近的 X 个条目，它返回一个 map 向量，如下所示: [{:itemID "item1" :category "stuff" :price 5} {:itemI
clojure - 如何删除嵌套的 clojure 向量
我有 ([[AA ww me bl qw 100] [AA ee rr aa aa 100] [AA qq rr aa aa 90]] [[CC ww me bl qw 100] [CC ee rr

首页

博学

6Ren·AI

商城

Haskell 向量 C++ push_back 类比