gpt4 book ai didi

python - 在两个数组中查找重复值,Python

转载 作者:行者123 更新时间:2023-12-05 02:02:18 24 4
gpt4 key购买 nike

我有两个数组(A 和 B),每个数组大约有 50 000 个值。每个值代表一个 ID。我想创建一个包含三列的 Pandas 数据框,col1:数组 A 的值,col2:数组 B 的值,col3:带有标签“唯一”或“重复”的字符串。在每个数组中,ID:s 都是唯一的。

数组的长度不同。所以我不能做这样的事情来开始。

a = np.array([1, 2, 3, 4, 5])
a = np.array([5, 6, 7, 8, 9, 10])
pd.DataFrame({'a':a, 'a':b})

然后我想创建一个不同的 pandas 数据框,也有三列。一个用于 ID,另一个用于 ID 来自哪个数组(a 或 b)。然后按 ID 分组并计算出现次数。如果 >=2 那么我们有一个副本。

但我不知道如何在同一列中一个接一个地获取 numpy 数组(如 R 中的 rbind),同时根据值来自哪个数组创建另一列。

很可能有比我上面建议的更好的解决方案。有什么想法吗?

最佳答案

要查找两个数组中的重复元素,请使用 numpy.intersect1d:

In [458]: a = np.array([1, 2, 3, 4, 5])

In [459]: b = np.array([5, 6, 7, 8, 9, 10])

In [462]: np.intersect1d(a,b)
Out[462]: array([5])

关于python - 在两个数组中查找重复值,Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65923114/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com