python - 循环遍历一组 Python 数字或一组字母是否更快？-6ren

python - 循环遍历一组 Python 数字或一组字母是否更快？

转载作者：塔克拉玛干更新时间：2023-11-03 05:30:04

24

4

循环遍历 Python set 数字或 Python set 字母是否更快，因为每个集合的长度完全相同并且每个集合中的每个项目都是一样长？为什么？

我认为会有差异，因为字母 [a-zA-Z] 比数字 [0-9] 具有更多可能的字符，因此会更“随机”并可能在某种程度上影响散列。

numbers = set([00000,00001,00002,00003,00004,00005, ... 99999])

letters = set(['aaaaa','aaaab','aaaac','aaaad', ... 'aaabZZ']) # this is just an example, it does not actually end here

for item in numbers:
  do_something()

for item in letters:
  do_something()

其中 len(数字) == len(字母)

更新:我对 Python 的特定哈希算法以及此实现的幕后发生的事情很感兴趣。

最佳答案

可能有一些我不知道的 Python 特定实现细节与我在这里的一般论点困惑不堪，但是:

创建字符串集可能会比创建整数集慢一点(所有其他条件都相同)，因为对字符串的哈希操作需要一些(小)时间来运行，而整数的散列运算很简单。
迭代一个集合不执行任何散列操作，因此散列时间在这里无关紧要。
集合的迭代取决于集合中元素的数量和支持该集合的哈希表中的桶数。因此，哈希函数的分布仅在它导致哈希表增加桶计数时才重要。对于某些哈希表实现，这是不可能的(因为桶计数仅在负载因子超过阈值时增加，而不仅仅是因为冲突)。其他哈希表实现会在发生大量冲突时调整大小。我不知道 CPython 是哪个。
无论如何，您给出的一组整数的特定示例将生成分布均匀的哈希值。
有一种方法可以找出 Python 中哪个更快，即 timeit，并提供您关心的数据的真实示例。投机通常是浪费时间。

你可以看到 Python 的哈希算法的结果是这样的:

>>> foo = 3
>>> foo.__hash__()
3
>>> foo = 1856348
>>> foo.__hash__()
1856348
>>> foo = "\x00"
>>> foo.__hash__()
1
>>> foo = "\x01"
>>> foo.__hash__()
128000384
>>> foo = "\x02"
>>> foo.__hash__()
256000771

所以在我的 Python 副本上，那些哈希结果与这些 reported Python hash algorithms 匹配.与 CPython 一样，您可以查看源代码以确认算法。

关于python - 循环遍历一组 Python 数字或一组字母是否更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12347551/

24

4

0

文章推荐： c - Eratosthenes 筛法错误输出

文章推荐： java - 如何在 Java/jtds 应用程序中支持 SQL GO 语句？

文章推荐： java - 如何将 Web 服务部署到 Amazon EC2？

文章推荐： java - 随机洗牌类(class)成员的方法

mysql如何在没有函数的情况下识别纯数字和混合数字/字母？
在 MySQL 数据库中，我在表中有一列既有纯数字也有混合数字/字母。没有模式，如果是纯数字我想区分，标记为true，否则为false。有什么好的方法可以使用吗？我试过: ID REGEXP '^[[
从新数据框的列名中删除 "X"字母
这个问题在这里已经有了答案: Numbers as column names of data frames (2 个回答) Why am I getting X. in my column names
javascript - 字母/数字组合的正则表达式
尝试提出一个正则表达式来捕获诸如 AB1234 或 BA2321 之类的组。本质上需要捕获以 AB 或 BA 开头并后跟 4 位数字的任何内容。目前，我有类似的东西，但这似乎没有考虑数字 (AB|B
javascript - 字母 "pyramid"
var z = []; for(var i = 1; i len) z.push("a".repeat(len-i%len)) console.log(z.join("\n")); 关于jav
仅用于数字、字母、空格和连字符的正则表达式
我需要一个仅用于数字、字母、空格和连字符的正则表达式。像这样的 ^[a-zA-Z0-9]+$ 得到字母和数字，但我需要一个用于上述。这些真的很难理解! 最佳答案这是你需要的: /^[0-9A-Za
PDFBox UTF16 字母
有没有人可以帮助我解决 PDFBox 中的字母问题我正在尝试打印字母“ń”(波兰语字母)并且我得到了类似 þÿ J 的东西。 Dı B R O W 2S0 :K0 3I. 请帮忙! 最佳答案我遇到了
javascript - 视差滚动移动单词/字母
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
css - 在各种设备上换行的单词/字母
我尽量不让我的文本 block 把一个词分成几个部分并跳到下一行。对于每种设备尺寸，文本都会中断并造成可读性问题。我尝试将 marring-right 与 % 一起使用，但并没有太大帮助。这是我的哈
C++ 字母 -> 数字
这是我第一次向 Stack Overflow 发帖提问。我是编程新手，所以如果我说的奇怪或错误，请原谅。在下面的文件中；它读取目录并将其保存到变量 nAddress 中。然后删除文件扩展名；将文件分
javascript - 在鼠标悬停时重新排列文本/字母
我希望当用户将鼠标悬停在页面上时，我的页面上的某些文本会重新排列字母。例如，将鼠标悬停在“WORK”上，它就会变成“OWKR”。我怀疑需要 js，但我对 js 还是很陌生。下面是我的 html:
java - 如何获取一系列字符？ (字母)
我已经为此工作了几个小时，现在我有点卡住了....请帮助我。我是一个完全的编程障碍。除字母表方法外，所有方法都可以正常工作。它将接收两个字符(大写或小写)并返回由给定 char 值范围组成的字符串。
c++ - 输入中未知数量的字符串(字母)
我想编写一个程序，在输入的同一行中读取 n 个不同化学元素的名称(其中 1 ≤ n ≤ 17 和 n 也在输入中读取)(名称由空格分开)。化学元素的名称应存储在不同的字符串中以供进一步使用。由于 n
jquery - 在悬停时显示另一个文本/字母
我想隐藏一个字母，并在链接中显示另一个字母，当然，悬停字母的样式不同。例如: 这是一个... ...normal link. 这是一个... ...hovêrêd lînk. 如何实现？谢谢。编辑:
css - 字母 i 上的替代色点
我一直被这个相当愚蠢的想法所挑战。所以我可以用 Blabla[span class=superI]i[/span]rest 替换所有出现的“i”:) 我的想法是在真正的 i“后面”添加一个额外的(红
支持中文、字母、数字的PHP验证码
本文以实例演示5种验证码，并介绍生成验证码的函数。PHP生成验证码的原理：通过GD库，生成一张带验证码的图片，并将验证码保存在Session中。 ?
JS正则表达式必须包含数字、字母、特殊字符
下面给大家介绍下JS正则表达式必须包含数字、字母、特殊字符 js正则表达式要求: 1. 必须包含数字、英文字母、特殊符号且大于等于8位 2. 特殊符号包括: ~!@#$%^&* 正
php - preg_match 字母不仅是字母？
我在这里和网上四处寻找解决方案。问题是我只想接受信件。但是，如果我至少输入一个字母，无论是否有符号或数字，它都会接受。如何获得仅封信？ if (!preg_match("/[a-zA-Z]/",
history - 字母 O 被认为有害？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 去年关闭。 Improve th
将(字母)数字字段正确读入 R
制表符分隔的文本文件，实际上是数据库表的导出(使用 bcp)，具有以下形式(前 5 列): 102 1 01 e113c 3224.96 12 102 1 01 e185
php - 循环数据数组并打印 'incrementing' 字母
我需要循环遍历数据数组并为每个数组值打印一个“递增”字母。我知道我可以做到这一点: $array = array(11, 33, 44, 98, 1, 3, 2, 9, 66, 21, 45); //

首页

博学

6Ren·AI

商城

python - 循环遍历一组 Python 数字或一组字母是否更快？