gpt4 book ai didi

arrays - 在 Ruby 中生成大量独特的 token

转载 作者:数据小太阳 更新时间:2023-10-29 08:35:35 26 4
gpt4 key购买 nike

我需要为两个代码列表生成很多唯一代码,它们不能相互匹配并且是唯一代码。它的长度必须为七个字符。

但我对我的最终解决方案不满意,我不得不整夜运行。

  • 我本来想使用集合(因为集合比数组快),但我不能像使用数组那样在所选索引处将集合分成两部分。

  • 我想并行化 token 创建,但这意味着管理共享代码数组以检查唯一性,以及所有涉及的锁问题。

这是我使用的代码:

# n is the token length, quantity the number of tokens I want.
def gen_codes(n=7, quantity=10)
tokens = []
quantity.times do |q|
token = [*('a'..'z'), *('A'..'Z'), *(0..9)].sample(7).join
while tokens.include?(token)
token = [*('a'..'z'), *('A'..'Z'), *(0..9)].sample(7).join
end
tokens << token
end
tokens
end

CODES1 = 750e3.to_i
CODES2 = 250e3.to_i

puts "Generating codes"

codes = gen_codes(7, CODES1+CODES2)
codes2 = codes[0, CODES2]
codes1 = codes[CODES2, CODES1]

File.open('codes1.txt', 'w+') do |f|
f.puts codes1
end

File.open('codes2.txt', 'w+') do |f|
f.puts codes2
end

有没有人有更好的解决方案?

最佳答案

这应该有效:

require 'set'

alphabet = [*('a'..'z'), *('A'..'Z'), *(0..9)]

CODES1 = 750_000
CODES2 = 250_000

set = Set.new
set << alphabet.sample(7).join until set.size == CODES1 + CODES2
codes = set.to_a

codes1 = codes[0...CODES1]
codes2 = codes[CODES1..-1]

File.write('codes1.txt', codes1)
File.write('codes2.txt', codes2)

在我的系统上大约需要 4 秒。

关于arrays - 在 Ruby 中生成大量独特的 token ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46234430/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com