gpt4 book ai didi

Python:对字符串执行取模

转载 作者:行者123 更新时间:2023-12-03 19:56:33 26 4
gpt4 key购买 nike

我有几十亿个字符串,格式为 word0.word1.word2,我希望对这些字符串执行取模,以便我可以将每个字符串提供给数据库编写器进行存储。我知道我可以对字符串的第一个字符执行模 10 的形式,如下所示:

for i in ["a.b","c.d"]: 
print ord(i[0]) % 10

但是,这不会均匀地划分我的字符串,因为 word0、word1 和 word2 按字母顺序排序,并且字符串的第一个字符通常是“a”。我可以取字符串的最后一个字母,但不确定它们是否正态分布。

我的问题 :有没有一种快速的方法可以在整个字符串上执行类似“ord”的操作?我最终计划在字符串的整数表示上运行模 48,并希望该模输出均匀分布在所有 48 个内核上。如果其他人可以提供任何帮助,我将不胜感激。

最佳答案

s = "whatever"  # have a string
h = hash(s) # obtain its hash
bin = h % 48 # find the bin

更新:Python 的内置 hash函数仅为单个进程提供确定性值。如果您想将此信息(直接或间接)保存在数据库中,您必须使用不包含任何随机数据的显式哈希函数。 (归功于@Alik)

关于Python:对字符串执行取模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31516005/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com