standards - UUID 的人类可读替代方案-6ren

standards - UUID 的人类可读替代方案

转载作者：行者123 更新时间：2023-12-04 12:27:40

26

4

我正在开发一个系统，该系统大量使用假名来向研究人员提供隐私关键数据。这些假名应具有以下属性:

它们不应包含任何信息(例如创建时间、与其他假名的关系、编码数据等)。

创建独特的假名应该很容易。

它们应该是人类可读的。这意味着人们在大声朗读时应该很容易比较、复制和理解它们。

我的第一个想法是使用 UUID4 .他们在 (1) 和 (2) 方面做得很好，但在 (3) 方面不太好。

一种变体是使用更宽的字母表对 UUID 进行编码，从而产生更短的字符串(参见例如 shortuuid )。但我不确定这是否真的提高了可读性。

我目前正在研究的另一种方法是 2005 年发表的一篇题为 "An optimal code for patient identifiers" 的论文。旨在解决我的问题。那里描述的算法创建了具有 30 位熵的 8 个字符的假名。不过，我更愿意使用更广泛审查的标准。

然后还有 git 方法:只显示实际假名的前几个字符。但这意味着假名可能会在一段时间后失去其独特性。

所以我的问题是:对于人类可读的唯一 ID，是否有任何广泛使用的标准？

最佳答案

不知道任何广泛使用的标准。这是一个不广泛使用的:

Proquints

https://arxiv.org/html/0901.4016

https://github.com/dsw/proquint

UUID4(128 位)将转换为 8 个 proquint。如果太多了，你可以取 UUID4 的最后 64 位(= 只取 64 个随机位)。这并不会让它神奇地失去独特性；只会增加碰撞的可能性，它一开始不是零，你可以用数学方法估计它是否仍然适合你的目的。

关于standards - UUID 的人类可读替代方案，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49506313/

26

4

0

文章推荐： xaml - 绑定(bind)到 ControlTemplate 内的嵌套属性

文章推荐： R中基于大数据集中重复数据不足的行删除

文章推荐： google-api - 在 storage api 中查找 HTTP Batch 的用法

nlp - (人类)文档的语言
有没有一种方法(程序、库)可以大致了解文档是用哪种语言编写的？我有一堆混合语言的文本文档(~500K)，需要导入支持 i18n 的 CMS (Drupal).. 我不需要完美的匹配，只需要一些猜测。
java - Java数字，“人类”舍入
Closed. This question needs details or clarity。它当前不接受答案。
html - 在一个网页上使用多种自然(人类)语言的最佳实践？
使用 UTF-8 编码。 (Multiple languages in one HTML page)。跨不同浏览器(包括 iPad 上的 Safari)在单个网页上正确显示多种人类语言的最佳做法是什
c++ - 使用两种(人类)语言的应用程序
我有一个完全可用的代码，它是为 Windows 编写的，是用 Visual Studio 构建的。我想做的是为该软件添加另一种语言。我的想法是在窗口角落放置两个标志(一个英语和一个德语)，并在用户点
Lua 字节码到 Lua 人类 "readable"
我刚刚得到一个脚本，我想对其进行一些更改，我正在寻找某人为我开发一份自由职业，以使我将提供的加载字符串可读以进行编辑。 Lua代码是这样的: ------------------------- ENG
algorithm - 高级(口语/人类)语言翻译项目？
有没有不是简单逐字翻译的语言翻译项目？一个具有先进算法/设计的？目前主流和流行的翻译软件，例如谷歌翻译，似乎是查找一个词或一组连续的词，然后将其直接翻译成不知何故确定为最佳匹配的内容。但是因为它不是
java - Twilio - 人类/非人类/机器人检测(IfMachine 参数)
基于 Twilio 的人类/非人类检测 - 我正在尝试通过如下所示的代码来检测调用是否被人类或机器人接听 HashMap params = new HashMap(); params.put("Fro
php - 我是否破坏了以下处理 3 种(人类)语言的 php 数组中的任何 "php good practice"？
这是目前(不确定)我能想到的处理多语言网站的最佳方式，它不涉及 gettext、zend_translate 或任何 php 插件或框架。我认为它非常简单:我有 3 种语言，我将它们的“内容”写在不

首页

博学

6Ren·AI

商城

standards - UUID 的人类可读替代方案