Python字典，寻找特定的方法-6ren

Python字典，寻找特定的方法

转载作者：太空宇宙更新时间：2023-11-04 09:43:50

25

4

假设我有一个字典，其中的字符串作为键，值作为整数。在哪里键将是遇到的不同字符串以及遇到的次数。

例如:"word word word" 会产生:{"word": 3}

我想对变量说:

item -> our dictionary
string -> word encountered

if string in item:
    # increase existing keys' value by 1
    item.update({string, item.get(string) + 1})

else:
    # create the key and initialize value to 1
    item.update({string : 1})

这个算法很慢，因为通过调用 update 和 string in item 方法进行两次散列，如果 python 执行散列以检查 string 是否存在，会更快如果键存在，项目要么将值增加 1，要么创建键并将值设置为 1。

在 Java 中相应的方法是:

item.merge(string, 1, Integer::sum)

将 if-else 语句中的代码减少到只有一行，并再次跳过散列。只是想知道 python 3 中是否存在这种方法。

提前致谢!

最佳答案

我使用不同的方式来填充字典，做了一些时序分析。首先，设置:

import collections, re    
lorem = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."
words = re.findall("\w+", lorem.lower())

现在，函数，使用你的方法和 update，或者只使用 +=，或者 get默认情况下，以及 defaultdict和 Counter :

def f1():
    d = {}
    for w in words:
        if w in d:
            d.update({w: d[w] + 1})
        else:
            d.update({w: 1})
    return d

def f2():
    d = {}
    for w in words:
        if w in d:
            d[w] += 1
        else:
            d[w] = 1
    return d

def f3():
    d = {}
    for w in words:
        d[w] = d.get(w, 0) + 1
    return d

def f4():
    d = collections.defaultdict(int)
    for w in words:
        d[w] += 1
    return d

def f5():
    return collections.Counter(words)

它们都产生相同的结果，尽管最后两个使用 dict 的子类:

In [41]: f1() == f2() == f3() == f4() == f5()
Out[41]: True

在这里使用 update 非常浪费； += 是最快的，即使有 in 检查，而 defaultdict 和 Counter 更短，但也更慢。

In [42]: %timeit f1()
10000 loops, best of 3: 81.8 us per loop

In [43]: %timeit f2()
10000 loops, best of 3: 24.8 us per loop

In [44]: %timeit f3()
10000 loops, best of 3: 40.8 us per loop

In [45]: %timeit f4()
10000 loops, best of 3: 52.6 us per loop

In [46]: %timeit f5()
10000 loops, best of 3: 104 us per loop

但是请注意，在此示例文本中，大多数单词只出现一次，这可能会使测试出现偏差。使用 words = words * 100，我们得到了这个，使 Counter 不那么慢，而 defaultdict 最快。

In [2]: %timeit f1()
100 loops, best of 3: 8.21 ms per loop

In [3]: %timeit f2()
100 loops, best of 3: 2.76 ms per loop

In [4]: %timeit f3()
100 loops, best of 3: 3.58 ms per loop

In [5]: %timeit f4()
100 loops, best of 3: 2.13 ms per loop

In [6]: %timeit f5()
100 loops, best of 3: 6.11 ms per loop

不过，我个人还是会使用 Counter，因为运行时间的差异可能不是什么大问题，它是最短的，意图很明确，而且它还提供了一些有用的辅助方法，比如获取最常见的条目等。

关于Python字典，寻找特定的方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50553442/

25

4

0

文章推荐： python - 在 python 中计算嵌套总和

文章推荐： css - Rails - 类不适用于链接到 Controller /操作

文章推荐： html - CSS背景图片滚动动画

文章推荐： python - 如何拆分字符串并选择特定字段

字典 .title() 中的 Python 字典
我只想国家和资本化的值(value)。这是我的完整代码: cities = { 'rotterdam': { 'country': 'netherlands',
vba - Excel VBA - 字典.Exists(字典)？
想更好地了解如何比较对象类型的键。 dicOverall.exists(dic2) 返回 False，而 dicOverall.exists(dic1) 返回 True。我不太确定 .Exists 如
Python - 字典
我是编程和 python 的新手，我不知道如何解决这个问题。 my_dict = {'tiger': ['claws', 'sharp teeth', 'four legs', 'stripes'
JavaScript 字典
这个问题已经有答案了: Accessing an object property with a dynamically-computed name (19 个回答) 已关闭 8 年前。我引用了这篇文
Python数据结构，字典？
希望有人能帮忙。我正在使用 Python，我希望能够执行以下操作。我有一组对象(例如形状)和一系列作用于这些对象的命令。命令的格式为命令字符串，后跟可变数量的参数，可以是字符串或整数例如形状“矩形
Python内存管理——字典
我在文件中保存了一本字典。我从 python 交互式 shell 将字典加载到内存中，我的系统监视器显示 python 进程消耗了 4GB。以下命令提供以下输出: size1 = sys.getsiz
仅当定义了值时才更新 Python 字典
如果我运行以下代码: import json foo = [ { "name": "Bob", "occupation": "", "stand
r - 将所有列名及其索引对保存为数据框/字典
我尝试获取列名及其索引，并将结果保存为数据框或字典: df <- data.frame(a=rnorm(10), b=rnorm(10), c=rnorm(10)) 我该怎么做？谢谢。 column
python - 字典，从键中调用值
我正在尝试获取输入，如果字典 logins 有一个与我的输入匹配的键，我想返回该键的值。 logins = { 'admin':'admin', 'turtle':'password1
Perl CPAN 字典
在 Perl 世界中有一个很棒的东西叫做 CPAN .它是开源 Perl 库的大型存储。我使用来自 CPAN 的模块，我已经发布了 several distributions myself . 我使
Python "valueless"字典
这个问题已经有答案了: Is there a Python dict without values? (3 个回答) 已关闭 3 年前。我有一个问题，我想跟踪大量值。如果我从未遇到过该值，我将执行操
.net - 使用带有字符串键和不区分大小写的搜索的哈希表/字典
想知道这是否可能。我们有一个第 3 方库，其中包含有关用户的识别信息... 与库的主要交互是通过一个以字符串为键的 HashTable，并返回该键的信息对象图。问题是， key 显然是区分大小写的
F#:字典、哈希表和映射之间的区别
我是 .NET 编程的新手。对不起，如果这个问题以前被问过。我目前正在学习 F#。 Dictionary、Hashtable 和 Map 之间有什么区别？我应该什么时候使用？我还有一个标题中没有提
opencv - 使用功能包进行分类的词汇/字典
我正在尝试使用SVM进行3类分类。为此，我正在SVM培训期间准备词汇表。但是，由于我在SVM预测期间获得随机结果，因此我怀疑我的词汇创建方法中存在一些问题。我创建词汇的代码如下: //Mat trai
r - 为什么R的关联数组被称为列表而不是映射/字典
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
python - 字典:如何列出包含某个值的每个关键路径？
假设我有一个以下形式的嵌套字典: {'geo': {'bgcolor': 'white','lakecolor': 'white','caxis': {'gridcolor': 'white', 'l
java - 字典:硬编码与外部文件
我有一个 java 应用程序，每秒启动和停止数亿个项目(从外部脚本调用)多次。 Input: String key Output: int value 此应用程序的目的是在从未永远改变的Map(约30
excel - 字典、集合和数组的比较
我正在尝试找出字典与集合和数组相比的相对优势和功能。我发现了一篇很棒的文章here但找不到一个简单的表格来比较所有不同的功能。有人知道吗？最佳答案请参阅下表，对集合和字典进行有用的比较。 (该
具有默认值的 .net 字典
我想要一个字典，它可以为字典中没有的任何键返回一个指定的值，例如: var dict = new DictWithDefValues("not specified"); dict.Add("bob78
python - 多个函数中的相同列表/字典
我是 python 新手，目前仍在学习如何处理列表和字典。我有这两个功能 def food_database(item_name, size_serv, calorie_serv, prot

首页

博学

6Ren·AI

商城

Python字典，寻找特定的方法