- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我有一个系统要求生成一个 11 个字符的字符串,其中最右边的 8 个字符必须是唯一的。
据我了解,这种情况每天最多发生几百次。不幸的是,由于速度问题,我被要求避免使用数据库来简单地检索序列中的 nextval()。
所以我不得不测试各种方法来尽可能好地生成随机数,并且我想出了一个基于 SecureRandom 类的解决方案。
我决定对其进行测试,看看生成的字符串 self 重复的可能性有多大;我使用 HashMap (string, string) 测试了 1000 万代 - 看起来不错,并希望在晚上测试十亿个随机字符串,但由于线程“main”java.lang.OutOfMemoryError 中的异常而失败:Java堆空间
我目前的测试代码是这样的:
public class Main {
public static BigInteger BASE = BigInteger.valueOf(62);
public static final String DIGITS = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
public static void main(String[] args) {
// TODO Auto-generated method stub
long lStartTime = System.nanoTime();
HashMap<String, String> orders = new HashMap<String, String>();
for (int i = 0; i < 960000000; i++) {
SecureRandom randObj = new SecureRandom();
BigInteger BigRand = new BigInteger(128, randObj);
String rand = BigRand.toString(62);
StringBuilder result = new StringBuilder();
while (BigRand.compareTo(BigInteger.ZERO) == 1 && result.length()<11) { // number > 0
BigInteger[] divmod = BigRand.divideAndRemainder(BASE);
BigRand = divmod[0];
int digit = divmod[1].intValue();
result.insert(0, DIGITS.charAt(digit));
}
String doesKeyExistString = orders.get(result);
if (doesKeyExistString != null) {
System.out.print("Duplicate key found!: "+result.toString()+"\n");
} else {
orders.put(result.toString(), result.toString()); // No such key
}
}
long lEndTime = System.nanoTime();
long difference1 = lEndTime - lStartTime;
double difference = (double)difference1/1000000000;
System.out.println("Elapsed seconds: " + difference);
System.out.println("Elapsed exact: " + difference1);
}
您有什么建议可以证明我们可以依赖这种生成随机数的方法,并且有可能将相同的字符串足够小两倍?
我偶然发现了这个问题:random number generator test答案看起来很有趣,但我不太明白如何将其应用到我的案例中(统计学是我最难的类(class),我第二次尝试勉强通过了......)
我也不确定,如何调整这个随机生成器以动态设置生成的数字的长度。必须有比我在这里做的更好的方法来做到这一点......
谢谢!
最佳答案
让我们来看看这里的原始数字。
您正试图在 HashMap
中存储 10 亿个 11 个字符长的字符串。
如果我们计算这个(11 个字符数组 + 长度为 int)的绝对最小空间,则:
1e9 * (11 * 2 bytes + 4 bytes) = 26e9 bytes
或大约 24 GB。那就是您的解决方案需要多少内存。
如果我们看等式的另一边。您希望使用 62 个字符的字母表随机生成两个长度为 8 的相等字符串。这意味着你有
62 ^ 8 = 218340105584896
或者关于 2.18e14
的不同组合。看着 birthday problem我们可以计算我们需要生成的字符串数量,以至少有 50% 的概率生成相同的字符串两次。根据公式,该数字约为 1.74e7
倍。因此,如果您生成 1800 万个字符串,则两次生成相同字符串的概率超过 50%。
1800万个字符串应该只需要
1.8e7 * (11 * 2 bytes + 4 bytes) = 4.68e8 bytes
或大约 470 兆字节,这应该在您的限制范围内。
现在,至于您的实际问题 - 使用 random UUID如果可能的话,因为您可以依赖两次生成相同 UUID 的可能性,就所有实际目的而言,这是不存在的。
如果您不能使用 UUID 但必须使用这 8 个字符,我建议您稍微扩展一下字母表。通过使用所有可打印的 ASCII 字符(95 个字符),您可以将可能的组合数量增加到略低于 6.1e15 - 尽管 50% 的碰撞机会的生成数仅增加到大约 9000 万。
关于Java Unique Number Generator 碰撞测试内存不足,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30611391/
我是 Julia 的新手。 我主要用python编程。 在 python 中, 如果你想迭代大量的值, 通常构造一个所谓的生成器来节省内存使用。 这是一个示例代码: def generator(N):
这个问题很奇怪。我试图直接在 build.gradle 中添加一个字符串,因为我需要它来使用 Tray 库 ( https://github.com/grandcentrix/tray )。在我的第一
我正在尝试在我的新 symfony3 项目中使用生成 CRUD 功能。我创建了一个名为 AdminBundle 的 bundle ,其中包含生成器、实体测试以及生成器,所有这些都处理得很好。我检查了我
我尝试理解生成器,但我发现了一个我无法遵循的示例。 // First Generator function* Colors () { yield "blue"; yield* MoreColo
我将制作一款完全由程序生成的空间/交易/战斗游戏。但是,我知道将整个星系的所有细节存储在内存中是不可行的。因此,我一直认为我可以使用种子来生成太阳系,并且从该太阳系,您可以使用跳跃门前往其他太阳系。问
我在 Eclipse Helios 中使用 MyBatis Generator (MyBatis Generator 1.3.1.201101032122),但每次我自动生成持久类时,生成器都会删除属
@GenerateInterface class A {} @GenerateInterface class B { void setA(IA a) {} } 我的注释处理器应该生成这些接口(in
我刚刚在一个空目录中安装了 yeoman,它打印出一个错误。这就是我所做的: npm i yo -g npm i generator-webapp -g 之后我抛出一个错误: require('yeo
我正在使用 NReco PDFGenerator 从 HTML 字符串创建 PDF 文档。当表格被分页符拆分时,表格标题与表格中的下一行重叠(见下图)。 有想法该怎么解决这个吗? 最佳答案 我发现这是
我有这个命名空间: namespace :manage do # Directs /manage/products/* to Manage::ProductsController
我有一个 Open API 3 规范的 yaml 文件,它有一些 x- 前缀的属性。我正在尝试使用 openapi-generator-cli 生成一个 Angular Typescript SDK。
我有一个返回生成器的函数。目前它使用yield from: function foo() { $generator = getGenerator(); // some other st
我选择Symfony2 docs 。据说添加 /** * @ORM\Entity(repositoryClass="Acme\StoreBundle\Entity\ProductRepository
运行命令生成新的 rails 项目: $ rails generate controller home index 以上将创建四个新的 Rails 项目:generate、controller、hom
我们实际上已经将jvm内存增加到了256M,现在老年代看起来很小,但Perm Generation相当高,接近80%。通过 jstat 捕获的示例数据如下。高永久代意味着什么? Timestamp
class Invoice def Invoice.generate(order_id, charge_amount, credited_amount = 0.0) Invoice.new
我在写 this comparison为了帮助人们理解所有这些废话,目前看来,generator-angular 的好处和值(value)只是您使用 generator-angular-fullsta
我有一个包含以下代码段的 OpenAPI 规范文档(我无法控制): servers: - url: http://www.[someservice].com/api 我正在使用这个 OpenAPI
我正在使用 openapi-yaml 将 swagger 文件转换为开放的 API v3 文件。使用 Maven 生成器。 我想做的是将新文件直接放入某个目录。 但是会生成一些我不需要的其他文件,例如
我的生成器中有以下标准文件夹结构。我当前正在努力解决的任务是我目前有一个模板化的 _package.json ,我将其写入磁盘以用于主要生成。我想在编写的 package.json 中包含一个变量,它
我是一名优秀的程序员,十分优秀!