python - 将重复元素设置为零-6ren

python - 将重复元素设置为零

转载作者：行者123 更新时间：2023-11-28 22:43:07

25

4

如何将数组“data”中的重复元素转换为 0？它必须逐行完成。

data = np.array([[1,8,3,3,4],
                 [1,8,9,9,4]])

答案应该如下:

ans = array([[1,8,3,0,4],
             [1,8,9,0,4]])

最佳答案

方法 #1

一种方法 np.unique -

# Find out the unique elements and their starting positions
unq_data, idx = np.unique(data,return_index=True)

# Find out the positions for each unique element, their duplicate positions
dup_idx = np.setdiff1d(np.arange(data.size),idx)

# Set those duplicate positioned elemnents to 0s
data[dup_idx] = 0

sample 运行-

In [46]: data
Out[46]: array([1, 8, 3, 3, 4, 1, 3, 3, 9, 4])

In [47]: unq_data, idx = np.unique(data,return_index=True)
    ...: dup_idx = np.setdiff1d(np.arange(data.size),idx)
    ...: data[dup_idx] = 0
    ...: 

In [48]: data
Out[48]: array([1, 8, 3, 0, 4, 0, 0, 0, 9, 0])

方法 #2

您还可以使用排序和微分作为更快的方法-

# Get indices  for sorted data
sort_idx = np.argsort(data)

# Get duplicate indices and set those in data to 0s
dup_idx = sort_idx[1::][np.diff(np.sort(data))==0]
data[dup_idx] = 0

运行时测试 -

In [110]: data = np.random.randint(0,100,(10000))
     ...: data1 = data.copy()
     ...: data2 = data.copy()
     ...: 

In [111]: def func1(data):
     ...:     unq_data, idx = np.unique(data,return_index=True)
     ...:     dup_idx = np.setdiff1d(np.arange(data.size),idx)
     ...:     data[dup_idx] = 0
     ...: 
     ...: def func2(data):
     ...:     sort_idx = np.argsort(data)
     ...:     dup_idx = sort_idx[1::][np.diff(np.sort(data))==0]
     ...:     data[dup_idx] = 0
     ...:     

In [112]: %timeit func1(data1)
1000 loops, best of 3: 1.36 ms per loop

In [113]: %timeit func2(data2)
1000 loops, best of 3: 467 µs per loop

扩展到二维案例:

方法 #2 可以扩展到适用于二维数组的情况，避免像这样的任何循环 -

# Get indices  for sorted data
sort_idx = np.argsort(data,axis=1)

# Get sorted linear indices
row_offset = data.shape[1]*np.arange(data.shape[0])[:,None]
sort_lin_idx = sort_idx[:,1::] + row_offset

# Get duplicate linear indices and set those in data as 0s
dup_lin_idx = sort_lin_idx[np.diff(np.sort(data,axis=1),axis=1)==0]
data.ravel()[dup_lin_idx] = 0

sample 运行-

In [6]: data
Out[6]: 
array([[1, 8, 3, 3, 4, 0, 3, 3],
       [1, 8, 9, 9, 4, 8, 7, 9],
       [1, 8, 9, 9, 4, 8, 7, 3]])

In [7]: sort_idx = np.argsort(data,axis=1)
   ...: row_offset = data.shape[1]*np.arange(data.shape[0])[:,None]
   ...: sort_lin_idx = sort_idx[:,1::] + row_offset
   ...: dup_lin_idx = sort_lin_idx[np.diff(np.sort(data,axis=1),axis=1)==0]
   ...: data.ravel()[dup_lin_idx] = 0
   ...: 

In [8]: data
Out[8]: 
array([[1, 8, 3, 0, 4, 0, 0, 0],
       [1, 8, 9, 0, 4, 0, 7, 0],
       [1, 8, 9, 0, 4, 0, 7, 3]])

关于python - 将重复元素设置为零，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31096939/

25

4

0

文章推荐： python - 在 Python 中查找值落在两个数字之间的位置

文章推荐： java - web.xml导致Tomcat7失败

文章推荐： Python 使用 numpy\pandas 选择多个范围

java - 设置 JTextField 设置
这个问题已经有答案了: Is there any way to accept only numeric values in a JTextField? (20 个回答) It's possible i
C# 获取/设置 BIOS 设置？
我使用戴尔 XPS M1710。笔记本电脑的盖子、侧面扬声器和前置扬声器都有灯(3 组灯可以单独调节)和鼠标垫下方的灯。在 BIOS 中，我可以更改这些灯的颜色，至少是每个组。另外，我可以在鼠标垫下打
iphone - 在“设置”应用中打开 Twitter 设置
我知道我可以使用在 iOS 5 中打开设置应用 [[UIApplication sharedApplication] openURL:[NSURL URLWithString:@"prefs://"
python - 为 sphinx 设置 Django 设置(文档)
我有一个 Django 应用程序，我正在尝试为其设置文档。目录结构如下: - doc - project | - manage.py 我已经设置了路径以便 Sphinx 可以看到东西，但是当我尝试使用
performance - apache 服务器达到 MaxClients 设置，考虑提高 MaxClients 设置
我正在使用 768mb ram 运行 centos 5.5。我一直在日志中获取 server reached MaxClients setting, consider raising the MaxC
performance - 服务器达到 MaxClients 设置，请考虑提高 MaxClients 设置。装甲运兵车
我在具有以下配置的服务器内运行了 Drupal 安装: StartServers 5 MinSpareServers 5 MaxSpareServers 15 MaxClien
c# - 使用 Microsoft.Web.Administration 设置 ASP 设置
是否可以使用 Microsoft.Web.Administration 包为给定的 location 配置 asp 设置？我想以编程方式将以下部分添加到本地 IIS applicationHost.
kubernetes - 如何在 AKS 上使用 kubectl 设置 kube-proxy 设置
我一直在阅读为 kube-proxy 提供参数的文档，但没有解释应该如何使用这些参数。我使用 az aks create 创建我的集群使用 azure-cli 程序，然后我获得凭据并使用 kubect
php - 通过 JavaScript 设置 Cookie 与通过 PHP 设置 Cookie
我想知道与在 PHP 中使用 setcookie() 函数相比，在客户端通过 JavaScript 设置一些 cookie 是否有任何明显的优势？我能想到的唯一原因是减少一些网络流量(第一次)。但不是
javascript - 使用 jquery 设置 cookie，在页面加载时从 cookie 设置 bodyclass
我有一个按钮可以将 body class 设置为 .blackout 我正在使用 js-cookie设置cookie，下面的代码与我的按钮相关联。 $('#boToggle').on('click'
javascript - 如何根据我的窗口大小(台式机、平板电脑、手机)设置 slick.js 设置？
我有一堆自定义的 HTML div。我将其中的 3 存储在具有 slide 类的 div 中。然后，我使用该幻灯片类调用 slick 函数并应用如下设置: $('.slide').slick({
c# - 使用 C# 获取/设置 "File History"(Windows 8) 设置
我正在创建一个应该在 Windows 8(桌面)上运行的应用我需要: 允许用户使用我的应用启动“文件历史记录”。我需要找到打开“文件历史记录”的命令行。我需要能够显示“文件历史记录”的当前设置。
ruby - RVM 设置 ruby 默认值，当打开新终端时删除 RVM 设置，返回系统 ruby
我刚买了一台新的 MacBook Pro，并尝试在系统中设置 RVM。我安装了 RVM 并将默认设置为 ➜ rvm list default Default Ruby (for new shells)
node.js - 如何使用 Firebase-admin 为 NodeJs 设置 timestampsInSnapshots 设置？
由于有关 Firestore 中时间戳行为即将发生变化的警告，我正在尝试更改我的应用的初始化代码。 The behavior for Date objects stored in Firestore
android - 在 ICS 中，是否可以通过代码(以编程方式)设置 "Restrict background data"设置？
在 ICS 中，网络 -> 数据使用设置屏幕中现在有“限制后台数据”设置。有没有办法以编程方式为我的应用程序设置“限制后台数据”？或有没有办法为我的应用程序调出具有选项的“数据使用”设置？最佳
javascript - 使用 TypeScript 中的 Next JS 设置 Jest + React 测试库——设置 jest.config.js 时出错
我正在尝试使用 NextJS 应用程序设置 Jest，目前在 jest.config.js : module.exports = { testPathIgnorePatterns: ["/.n
FlashDevelop 设置
我最近升级到 FlashDevelop 4，这当然已经将我之前的所有设置恢复到原来的状态。我遇到的问题是我无法在新设置窗口的哪个位置找到关闭它在方括号、大括号等之前插入的自动空格的选项。即它会自动
iPhone 设置
有没有办法以编程方式访问 iPhone/iPod touch 设置？谢谢。比兰奇最佳答案大多数用户设置可以通过读取存储在 /User/Library/Preferences/ 中的属性列表来访问
Mysql配置/设置
删除某些值时，我需要选择哪些设置来维护有序队列。我创建了带有自动增量和主键的 id 的表。当我第一次插入值时，没问题。就像 1,2,3,4,5... 当删除某些值时，顺序会发生变化，例如 1,5,3.
Symfony2 设置
我正在尝试设置示例 Symfony2 项目，如此处所示 http://symfony.com/doc/current/quick_tour/the_big_picture.html 在访问 confi

首页

博学

6Ren·AI

商城

python - 将重复元素设置为零