python - 如何保留 SciPy 稀疏矩阵 COO_Matrix 中的插入顺序-6ren

python - 如何保留 SciPy 稀疏矩阵 COO_Matrix 中的插入顺序

转载作者：行者123 更新时间：2023-12-01 03:09:27

26

4

你好，Python 社区，

我有关于 numpy 稀疏矩阵 COO 格式的问题。如下:

我有一个csv 4 列文件 a , b , c , d我需要从这个 csv 文件形成 SciPy COO_Matrix，但我需要能够保留 SciPy 稀疏矩阵中条目的插入顺序。目前，我的数据按列 d 排序。最终在 Matrix 中我也希望保留这个顺序。目前，这就是我所做的:

 def _build_interaction_matrix(rows, cols, data, score):

mat = sp.lil_matrix((rows, cols), dtype=np.int32)
for a, b, c, d in data:
     mat[a, b] = 1.0
return mat.tocoo()

现在当我打电话时:

def get_triplets(mat):
    return mat.row, mat.col, np.random.randint(mat.shape[1], size=len(mat.row))

订单丢失了，我的订单是 a然后通过b 。有没有办法按键对矩阵排序 d这样我仍然返回一个 COO 矩阵 a和b作为列，但按 d 排序？

编辑:最终目标是能够通过保留顺序来迭代构建矩阵，然后将其转换为 COO 。我需要迭代执行此操作，因为列 c 上有一个条件我需要在循环中检查。

Edit2:我还需要实现 COO.getrow(row_index)它保留 row_index 列索引的原始顺序对于编辑2，

我能想到的最好的办法是:

def get_all_items(uid, pid, u):
init = 0
indices = np.argsort(uid, kind='mergesort')

for i in range(len(indices)):
    if (uid[indices[i]] == u and init == 0):
        start = i
        init = 1
    if(i >= 1 and uid[indices[i-1]] ==u and uid[indices[i]] != u):
        end = i
        idex = indices[start:end]
        if len(idex) != 0:
            return pid[idex]

感谢您为解决此问题提供的建议，如果您需要更多信息，请告诉我。

最佳答案

如果您直接以 coo 格式制作矩阵，则顺序会保留，至少在最初是这样:

In [165]: row=np.array([0,1,3,5,2,0])
In [166]: col=np.array([1,0,3,0,1,4])
In [170]: M = sparse.coo_matrix((np.ones(6,int),(row,col)))
In [171]: M
Out[171]: 
<6x5 sparse matrix of type '<class 'numpy.int32'>'
    with 6 stored elements in COOrdinate format>
In [172]: print(M)
  (0, 1)    1
  (1, 0)    1
  (3, 3)    1
  (5, 0)    1
  (2, 1)    1
  (0, 4)    1

事实上，row 和 col 属性将是输入数组(前提是它们兼容):

In [173]: M.row
Out[173]: array([0, 1, 3, 5, 2, 0])
In [174]: id(M.row),id(row)
Out[174]: (2858024776, 2858024776)   # same id

但是这个订单很容易丢失。例如，通过 csr 格式(在大多数计算中使用)的往返最终会按行排序，然后按列排序

In [178]: print(M.tocsr().tocoo())
  (0, 1)    1
  (0, 4)    1
  (1, 0)    1
  (2, 1)    1
  (3, 3)    1
  (5, 0)    1

如果有重复点，则将它们相加

转换为lil:

In [180]: M.tolil().rows
Out[180]: array([[1, 4], [0], [1], [3], [], [0]], dtype=object)

rows 根据定义按行排序，但在行内不必排序。

sum_duplicates 以列优先执行词法排序

In [181]: M.sum_duplicates()
In [182]: print(M)
  (1, 0)    1
  (5, 0)    1
  (0, 1)    1
  (2, 1)    1
  (3, 3)    1
  (0, 4)    1

<小时/>

迭代构建 lil 不会保留任何“订单”信息:

In [213]: Ml = sparse.lil_matrix(M.shape,dtype=M.dtype)
In [214]: for r,c in zip(row,col):
     ...:     Ml[r,c]=1
     ...:     print(Ml.rows)
     ...:     
[[1] [] [] [] [] []]
[[1] [0] [] [] [] []]
[[1] [0] [] [3] [] []]
[[1] [0] [] [3] [] [0]]
[[1] [0] [1] [3] [] [0]]
[[1, 4] [0] [1] [3] [] [0]]

获取行

getrow 不排序可能比我最初想象的更容易:

创建一个随机矩阵:

In [270]: M1=sparse.random(20,20,.2)
In [271]: M1
Out[271]: 
<20x20 sparse matrix of type '<class 'numpy.float64'>'
    with 80 stored elements in COOrdinate format>

In [273]: M1.row
Out[273]: 
array([10, 16,  2,  8,  5,  2, 15,  7,  7,  4, 16,  0, 14, 14, 12,  0, 13,
       16, 17, 12, 12, 12, 17, 15, 15, 18, 18,  0, 13, 13,  9, 10,  6, 10,
        2,  4,  9,  1, 11,  7,  3, 19, 12, 10, 13, 10,  3,  9, 10,  7, 18,
       18, 17, 12, 12,  2, 18,  3,  5,  8, 11, 15, 12,  3, 18,  8,  0, 13,
        6,  7,  6,  2,  9, 17, 14,  4,  5,  5,  6,  6], dtype=int32)
In [274]: M1.col
Out[274]: 
array([ 4, 15,  1, 10, 19, 19, 17,  2,  3, 18,  6,  1, 18,  9,  6,  9, 19,
        5, 15,  8, 13,  1, 13,  7,  1, 14,  3, 19,  2, 11,  6,  5, 17, 11,
       15,  9, 15,  7, 11, 15,  0, 16, 10, 10,  7, 19,  1, 19, 18,  9,  5,
        0,  5,  7,  4,  6, 15, 11,  0, 12, 14, 19,  3,  4, 10,  9, 13,  1,
        3, 13, 12, 18,  3,  9,  7,  7, 10,  8, 19,  0], dtype=int32)

行号为10的元素:

In [275]: M1.row==10
Out[275]: 
array([ True, False, False, False, False, False, False, False, False,
       ....
       False, False, False, False, False, False, False, False], dtype=bool)

相应的列值(未排序)

In [276]: M1.col[M1.row==10]
Out[276]: array([ 4,  5, 11, 10, 19, 18], dtype=int32)

将它们与使用 csr 格式的 getrow 进行比较:

In [277]: M1.getrow(10)
Out[277]: 
<1x20 sparse matrix of type '<class 'numpy.float64'>'
    with 6 stored elements in Compressed Sparse Row format>
In [278]: M1.getrow(10).indices
Out[278]: array([19, 18, 11, 10,  5,  4], dtype=int32)

通过 lil

In [280]: M1.tolil().rows[10]
Out[280]: [4, 5, 10, 11, 18, 19]

关于python - 如何保留 SciPy 稀疏矩阵 COO_Matrix 中的插入顺序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43011081/

26

4

0

文章推荐： javascript - Mongodb - 为什么我的 Users.findOne 未定义？

文章推荐： python - 无法单击页面 Selenium python 上的元素

文章推荐： Jquery 确认不起作用

文章推荐： python - 使用给定 key 的文件加密和解密

变异操作的 GraphQL 顺序
我正在创建一个有效的突变，但我不确定它是否按照我认为的方式工作。但是，我想知道执行顺序是什么？异步从上到下同步同步随机顺序其他我想确保在执行插入/更新插入之前从表中删除某些项目。使用以下突变
isabelle - field 顺序
如何更改规则中的前提顺序？例如，在伊莎贝尔的自然演绎规则中: mp: ?P ⟶ ?Q ⟹ ?P ⟹ ?Q 我们可以将顺序更改为: ?P ⟹ ?P ⟶ ?Q ⟹ ?Q 我可以用 rev_mp或者定义一
java - LinkedHashMap 顺序
关闭。这个问题需要details or clarity .它目前不接受答案。想改善这个问题吗？通过 editing this post 添加详细信息并澄清问题. 8年前关闭。 Improve thi
按关联的 hibernate 顺序
我正在使用 Hibernate 3.2，并使用标准来构建查询。我想为多对一关联添加和“排序”，但我不知道如何做到这一点。 Hibernate 查询最终看起来像这样，我猜: select t1.a, t
Javascript:顺序，而不是并行
我正在开发一个项目，但无法让我的 javascript 按顺序工作。我知道 javascript 可以并行执行任务，因此当您向不响应的服务器发出请求时，它不会被卡住。这有它的优点和缺点。就我而言，这是
dart - future 顺序
在下面的代码中，我认为f1 > f2 > f3是调用顺序，但是仅f1被调用。如何获得依次调用的3个函数？我已经将以下内容添加到main函数中，它可以按预期工作，但是我想知道是否还有其他确定的方法可以
javascript - 在对象数组中添加位置/顺序
我有一个如下所示的对象数组: [{ "id": 1, "Size": 90, "Maturity": 24, }, { "id": 2, "S
docker - Docker多阶段构建:顺序
这是征求意见和要求的请求。我是Docker的新手。我想要一个用于Python项目的生产和开发容器(可能也进行单元测试)。我的搜索指向多阶段Dockerfile(以及运行它们的多个docker-com
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
Cordova Hook 顺序
在 Cordova 网站上，您可以看到一长串按字母顺序排列的钩子(Hook)列表，但它们触发和执行的正确顺序是什么？我正在尝试在构建/编译之前将 cordova.js 脚本添加到 index.htm
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
JAVA HashSet 顺序
这个问题已经有答案了: 奥 git _a (2 个回答) 已关闭 9 年前。这是我的一个练习的代码， public class RockTest { public static void main(
java - java中哪些数据结构支持排序/顺序
我使用 HashMap 来存储一些数据，但每当新数据保存到 HashMap 或旧数据移出 HashMap 时，我都需要将其保持升序。但是hashmap本身不支持顺序，我可以使用什么数据结构来支持顺序？
f# - 顺序 - 随后几年的同一日期
我想创建一个序列，当星期几与函数参数中的日期相同时，它会返回所有年份的结果(例如:自开始日期起，2 月 12 日为星期日的所有年份)。 let myDate (dw:System.DayOfWeek)
C# LINQ 顺序
我有一个包含许多元素的 Xelement。我有以下代码来对它们进行排序: var calculation = from y in x.Elements("row")
Javascript Action 顺序
假设我有: 在 javacript 文件中，我为类按钮和 ID 名称定义了点击操作，例如: $("#name").click(function(event){ alert("hi"); }) $
Swift LayoutSubViews 顺序
我有一个包含 2 个 subview 的 View - collectionView 和自定义 View 。我想设置一个操作在布置 2 个 View 后运行，但layoutSubViews 运行了两次
Java 顺序 UUID
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 2年前关闭。 Improve this questi
c++ - 如何比较两个双向迭代器的(顺序)？
我想知道 C++ 中是否有内置方法来比较两个双向迭代器的顺序。例如，我有一个 Sum 函数来计算同一列表中 2 个迭代器之间的总和: double Sum(std::list::const_itera
MySQL ORDER BY 顺序
在 MySQL 中，这两个查询之间有区别吗？ SELECT * FROM .... ORDER BY Created,Id DESC 和 SELECT * FROM .... ORDER BY Cre

首页

博学

6Ren·AI

商城

python - 如何保留 SciPy 稀疏矩阵 COO_Matrix 中的插入顺序

获取行