python - 在字典中查找重复值并仅在具有相同键的值不同时才打印它们-6ren

python - 在字典中查找重复值并仅在具有相同键的值不同时才打印它们

转载作者：行者123 更新时间：2023-12-01 09:06:43

26

4

我正在从 CSV 文件创建一个三元组字典，其中键 - 行号和值包含三个整数的列表。我还创建了另一个字典(名称)，其中键为行号，值为两个字符串的列表。我想找到包含相同三元组的所有行，以防名称对不同。

到目前为止，我的代码正在查找所有重复项，以防两行上存在相同的三元组值，但如果在 3 行及更多行上存在重复项，则它将无法正常工作。我想更新或重写整个脚本，以便在出现 3 个或更多重复的情况下检查所有名称值是否不同并仅打印具有不同名称的行。例如，如果我们有以下三元组字典:三元组 = {1: [111, 222, 333], 2: [111, 222, 333], 3: [111, 222, 333], } 和 names = {1: ['name1', 'name2'], 2: ['name1', 'name2'], 3: ['name1', 'name3']} 这将导致创建另一个字典: duplicd_value_keys = {(111, 222, 333): [1, 2, 3]} 并且我的脚本不会显示重复项，因为 names[1] == names[2]但原则上它应该打印出第 2 行和第 3 行的三元组值具有不同的名称。

for csv_infile in os.listdir(input_dir):
        if csv_infile.lower().endswith('.csv'):
            csv_in = os.path.join(input_dir, csv_infile)
            with open(csv_in) as f_in:
                # Creating dictionaries containing as a key the line number and as a value
                triplet = {}
                names = {}
                l_num = 0
                for line in f_in:
                    l_num += 1
                    triplet[l_num] = [(line.split('\t')[1]), (line.split('\t')[2]), (line.split('\t')[3])]
                    names[l_num] = [(line.split('\t')[4].lower().strip()), (line.split('\t')[5].lower().strip())]

                # Finding the duplicated values and creating a new dictionary with values the line numbers.
                duplicated_value_keys = collections.defaultdict(list)
                for key, value in triplet.items():
                    duplicated_value_keys[tuple(value)].append(key)
                for duplicated_keys in duplicated_value_keys.values():
                    if len(duplicated_keys) >1 and names[duplicated_keys[0]] != names[duplicated_keys[1]]: 
                        print("There is a duplicated triplet on lines: {}.\n".format(', '.join(map(str, duplicated_keys))))

[编辑]:CSV 输入文件具有以下格式，并且以制表符分隔:

2       8004    3014    3       test name   1       14080   1       0       3478    1572    0       0
2       8004    3014    3       test name    1       8004    1       0       3478    1572    0       0
3       8004    3014    3       test name1   1       8004    1       0       3477    1571    0       0

最佳答案

可以使用defaultdict(list)来检测重复行。三元组将是字典的键，每个字典将包含找到该三元组的行号和名称的列表。读取所有条目后，迭代字典并仅显示包含不同名称的条目。例如:

import csv
from collections import defaultdict

triplets = defaultdict(list)

with open('test.csv', newline='') as f_input:
    csv_input = csv.reader(f_input, delimiter='\t')

    for line, row in enumerate(csv_input, start=1):
        triplets[tuple(row[1:4])].append((line, list(map(str.lower, row[4:6]))))

for triplet, entries in sorted(triplets.items()):
    if len(entries) > 1 and len({tuple(names) for line, names in entries}) > 1:
        print("Duplicate triplet: {} on lines:".format(triplet))
        for line, names in entries:
            print("  {}, {}, {}".format(line, *names))
        print()

对于给定的test.csv，这将产生:

Duplicate triplet: ('13115', '3209', '3') on lines:
  44, skylink, horor film
  69, skylink, private spice

Duplicate triplet: ('13139', '3219', '3') on lines:
  8, skylink, nova cinema
  13, skylink, prima zoom

Duplicate triplet: ('8004', '3014', '3') on lines:
  2, skylink, ct 2
  3, skylink, bar 2
  4, skylink, tst 22
  5, skylink, tst 22

关于python - 在字典中查找重复值并仅在具有相同键的值不同时才打印它们，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51986297/

26

4

0

文章推荐： Python:Tkinter TclError:无法调用 "image"命令

文章推荐： java - JSOUP 自动登录网站

文章推荐： java - Neo4j java 多 session

文章推荐： python - 将数据保存为新行，但在单个单元格中 lxml python

PHP - 使关联数组唯一，键 ->值和值 ->键
我在 php 方面遇到了一个小问题，我发现很难用语言来解释。我有一个包含键值的关联数组。我想制作一个函数(或者如果已经有一个函数)，它将一个数组作为输入并删除重复项，但两种方式都是如此。例如: 在我
c# - Winforms App (C#) 中的 Windows 键 + [键] 快捷方式
我有一个在系统托盘中运行的应用程序，是否可以允许用户通过 C# 中的 Windows 键 + 键恢复该应用程序？谢谢最佳答案是的，使用 Windows API。我认为 Windows 键与 C
mysql - findOne({键 :value}) or findOne(). 其中({键 :value}) when querying database with waterline?
我正在使用 Waterline通过 Sails 查询 MySQL 数据库。我找到了 2 种方法。不知道哪个更好？顺便问一下，如何处理这两种情况的错误？ 1. Model.findOne().whe
C# 键枚举混淆 : Keys. Alt 或 Keys.RButton |键.ShiftKey |键.Alt
我正在尝试测试是否按下了 Alt 键。我的支票类似于: private void ProcessCmdKey(Keys keyData) { if (keyData == Keys.Alt) {
ruby - 按 TAB 键，然后在带有 Ruby 的 Selenium WebDriver 中按 ENTER 键
我正在使用 Selenium WebDriver 和 Ruby 进行自动化测试。我需要点击一个按钮。我无法通过 id 或 css 或 xpath 获取按钮元素，因为按钮是透明的。我想使用 Tab 和
ide - 什么是⎋键
我是 IntelliJ 的新手，我看到一个启动提示说，“任何工具窗口中的 ⎋ 键都会将焦点移动到编辑器。”但是，我不知道⎋键是什么。我一直在编程很长时间。我的键盘上可能有一个我多年来一直错过的键吗？
javascript - 每次用户单击输入中的空格键时如何添加 + 键
我使用 OMDB API 创建了一个电影搜索页面。我遇到的问题是，如果我搜索一部包含多个单词的电影，此 API 会出错，因为 API 的 URL 必须在 URL 中的每个单词之间有 + 键。所以我想知
名称为彼此子字符串的 Elasticsearch 键
我已经用 Elasticsearch 玩了大约一天了，所以我非常陌生。我正在尝试 POST/import 一个简单的文件: { "compression" : "none", "com
javascript - 键/值对的值也可以是键吗？
enter image description here 在此示例中，要记录带有“title”和“director”键的属性值，使用 obj[key]。因为我们已经处于对象的执行上下文中:在本例中是电
来自同一台机器的多个项目的开放类次的 ssh 键
我是新开类。我使用新的电子邮件 ID 和密码在 openshift 上创建了一个项目。让我们称之为 firstApp 。我做了 rhc 设置和我的 ssh key 与我的项目相关联。我的 frie
java - Jackson反序列化json字符串但bean缺少json字符串的属性/键
当我使用 Jackson 反序列化 json 字符串时，我通常不想创建所有 bean 类的属性，而且我只需要一些 json 字符串的字段，其他字段我不需要。所以我经常只在我需要的 java 类 bea
clojure - 键*/具有内联值规范的键
我想编写一个带有 keys/keys* 的规范，但能够内联值规范，但不支持 by design ，我明白了其背后的原因。然而，有时，本地图存在特定上下文时，您确实希望(或者只是通过遗留或第三方)键和值
perl - 键/值的分配顺序是什么？
my %fruit_colors = ("apple", "red", "banana", "yellow"); my @fruits = keys %fruit_colors; my @colors
DataGridView/Enter 键？
我正在使用 vb.net 2008 和 DataGridView。我正在寻找允许我将 enter 键移动到右侧的下一列而不是在保持在同一列时向下移动一行的代码。最佳答案如果您正在确认编辑，只需移动
javascript - 迭代对象属性/键
我刚刚开始学习编码，我遇到了这个我无法理解的问题。 “我们将添加的第二个函数称为搜索，它将以名字作为参数。它将尝试将收到的名字与我们 friend 联系人列表中的任何名字相匹配。如果它找到匹配项，就会
python - 改变Python中的字典/键
我已经在 Python 中运行了下面的代码，以从文本文件中生成单词列表及其计数。我该如何从“Frequency_list”变量中过滤掉计数为 1 的单词？另外，如何将底部的打印语句循环导出到CSV
XSLT 键()查找
我正在尝试 XSLT 中的查找表示例，但无法使其正常工作
javascript - 从对象返回访问的属性名(键)
是否可以在 Javascript/Typescript 中编写一个将参数名称/键作为字符串返回的函数？ function foo(arg) {...} let user = new User(); f
对象中未填充 Javascript 键
我正在尝试创建一个带有键/值的对象，但是当我看到该对象时，键没有正确填充.. 我希望键是 - 0,1,2,3 但它显示“索引”作为键。 > categories = ["09/07/2016 00:0
Android模拟器硬件键盘[Esc]键
将 Android Studio 从 1.5 升级到 2.0 后，模拟器(现在版本为 25.1.1，我在其上配置了模拟硬件键盘)不再将 [Esc] 键识别为等同于 [Back] 按钮。如何恢复这个有

首页

博学

6Ren·AI

商城

python - 在字典中查找重复值并仅在具有相同键的值不同时才打印它们