- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
-6ren">
假设我有一个字典,其中的字符串作为键,值作为整数。在哪里键将是遇到的不同字符串以及遇到的次数。
例如:"word word word"
会产生:{"word": 3}
我想对变量说:
item -> our dictionary
string -> word encountered
if string in item:
# increase existing keys' value by 1
item.update({string, item.get(string) + 1})
else:
# create the key and initialize value to 1
item.update({string : 1})
这个算法很慢,因为通过调用 update
和 string in item
方法进行两次散列,如果 python 执行散列以检查 string 是否存在,会更快如果键存在,项目要么将值增加 1,要么创建键并将值设置为 1。
在 Java 中相应的方法是:
item.merge(string, 1, Integer::sum)
将 if-else
语句中的代码减少到只有一行,并再次跳过散列。只是想知道 python 3 中是否存在这种方法。
提前致谢!
最佳答案
我使用不同的方式来填充字典,做了一些时序分析。首先,设置:
import collections, re
lorem = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."
words = re.findall("\w+", lorem.lower())
现在,函数,使用你的方法和 update
,或者只使用 +=
,或者 get
默认情况下,以及 defaultdict
和 Counter
:
def f1():
d = {}
for w in words:
if w in d:
d.update({w: d[w] + 1})
else:
d.update({w: 1})
return d
def f2():
d = {}
for w in words:
if w in d:
d[w] += 1
else:
d[w] = 1
return d
def f3():
d = {}
for w in words:
d[w] = d.get(w, 0) + 1
return d
def f4():
d = collections.defaultdict(int)
for w in words:
d[w] += 1
return d
def f5():
return collections.Counter(words)
它们都产生相同的结果,尽管最后两个使用 dict
的子类:
In [41]: f1() == f2() == f3() == f4() == f5()
Out[41]: True
在这里使用 update
非常浪费; +=
是最快的,即使有 in
检查,而 defaultdict
和 Counter
更短,但也更慢。
In [42]: %timeit f1()
10000 loops, best of 3: 81.8 us per loop
In [43]: %timeit f2()
10000 loops, best of 3: 24.8 us per loop
In [44]: %timeit f3()
10000 loops, best of 3: 40.8 us per loop
In [45]: %timeit f4()
10000 loops, best of 3: 52.6 us per loop
In [46]: %timeit f5()
10000 loops, best of 3: 104 us per loop
但是请注意,在此示例文本中,大多数单词只出现一次,这可能会使测试出现偏差。使用 words = words * 100
,我们得到了这个,使 Counter
不那么慢,而 defaultdict
最快。
In [2]: %timeit f1()
100 loops, best of 3: 8.21 ms per loop
In [3]: %timeit f2()
100 loops, best of 3: 2.76 ms per loop
In [4]: %timeit f3()
100 loops, best of 3: 3.58 ms per loop
In [5]: %timeit f4()
100 loops, best of 3: 2.13 ms per loop
In [6]: %timeit f5()
100 loops, best of 3: 6.11 ms per loop
不过,我个人还是会使用 Counter
,因为运行时间的差异可能不是什么大问题,它是最短的,意图很明确,而且它还提供了一些有用的辅助方法,比如获取最常见的条目等。
关于Python字典,寻找特定的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50553442/
我只想国家和资本化的值(value)。 这是我的完整代码: cities = { 'rotterdam': { 'country': 'netherlands',
想更好地了解如何比较对象类型的键。 dicOverall.exists(dic2) 返回 False,而 dicOverall.exists(dic1) 返回 True。我不太确定 .Exists 如
我是编程和 python 的新手,我不知道如何解决这个问题。 my_dict = {'tiger': ['claws', 'sharp teeth', 'four legs', 'stripes'
这个问题已经有答案了: Accessing an object property with a dynamically-computed name (19 个回答) 已关闭 8 年前。 我引用了这篇文
希望有人能帮忙。我正在使用 Python,我希望能够执行以下操作。 我有一组对象(例如形状)和一系列作用于这些对象的命令。命令的格式为命令字符串,后跟可变数量的参数,可以是字符串或整数 例如形状“矩形
我在文件中保存了一本字典。我从 python 交互式 shell 将字典加载到内存中,我的系统监视器显示 python 进程消耗了 4GB。以下命令提供以下输出: size1 = sys.getsiz
如果我运行以下代码: import json foo = [ { "name": "Bob", "occupation": "", "stand
我尝试获取列名及其索引,并将结果保存为数据框或字典: df <- data.frame(a=rnorm(10), b=rnorm(10), c=rnorm(10)) 我该怎么做?谢谢。 column
我正在尝试获取输入,如果字典 logins 有一个与我的输入匹配的键,我想返回该键的值。 logins = { 'admin':'admin', 'turtle':'password1
在 Perl 世界中有一个很棒的东西叫做 CPAN .它是开源 Perl 库的大型存储。 我使用来自 CPAN 的模块,我已经发布了 several distributions myself . 我使
这个问题已经有答案了: Is there a Python dict without values? (3 个回答) 已关闭 3 年前。 我有一个问题,我想跟踪大量值。如果我从未遇到过该值,我将执行操
想知道这是否可能。 我们有一个第 3 方库,其中包含有关用户的识别信息... 与库的主要交互是通过一个以字符串为键的 HashTable,并返回该键的信息对象图。 问题是, key 显然是区分大小写的
我是 .NET 编程的新手。对不起,如果这个问题以前被问过。 我目前正在学习 F#。 Dictionary、Hashtable 和 Map 之间有什么区别?我应该什么时候使用? 我还有一个标题中没有提
我正在尝试使用SVM进行3类分类。为此,我正在SVM培训期间准备词汇表。但是,由于我在SVM预测期间获得随机结果,因此我怀疑我的词汇创建方法中存在一些问题。我创建词汇的代码如下: //Mat trai
就目前情况而言,这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放,visit
假设我有一个以下形式的嵌套字典: {'geo': {'bgcolor': 'white','lakecolor': 'white','caxis': {'gridcolor': 'white', 'l
我有一个 java 应用程序,每秒启动和停止数亿个项目(从外部脚本调用)多次。 Input: String key Output: int value 此应用程序的目的是在从未永远改变的Map(约30
我正在尝试找出字典与集合和数组相比的相对优势和功能。 我发现了一篇很棒的文章here但找不到一个简单的表格来比较所有不同的功能。 有人知道吗? 最佳答案 请参阅下表,对集合和字典进行有用的比较。 (该
我想要一个字典,它可以为字典中没有的任何键返回一个指定的值,例如: var dict = new DictWithDefValues("not specified"); dict.Add("bob78
我是 python 新手,目前仍在学习如何处理列表和字典。 我有这两个功能 def food_database(item_name, size_serv, calorie_serv, prot
我是一名优秀的程序员,十分优秀!