- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在生成有关用户操作的日志记录。出于隐私原因,这些需要在 N 天后匿名。但是,我还需要针对这些匿名数据运行报告。
我希望真实用户 A 的所有操作都列在匿名日志中的假用户 X 下 - 一个用户的记录必须仍然保留在日志中的一个(假)用户的记录。这显然意味着我需要在真实用户和虚假用户之间建立一些映射,我在对新记录进行匿名处理时会用到这些映射。当然,这完全违背了匿名化的目的——如果有映射,就可以恢复原来的用户数据。
例子:
User Frank Müller bought 3 cans of soup.
Three days later, User Frank Müller asked for refund for 3 cans of soup.
当我匿名化第二个日志条目时,第一个日志条目已经被匿名化。我仍然希望两个日志记录都指向同一个用户。好吧,这对我来说在实践中似乎几乎是不可能的,所以我想使用一些拆分数据的方法,希望能让我在数据中保持尽可能多的完整性。也许将日志用作数据仓库 - 将所有内容拆分为事实,并接受无法分析某些维度的事实?
你遇到过这样的场景吗?我在这里有什么选择?我显然需要做出某种妥协——什么对你有效?如何充分利用这些数据?
最佳答案
冒着学究气的风险,您描述的不是匿名数据,而是假名数据。也就是说,您是否考虑过使用某种键控哈希函数,例如 HMAC-SHA1执行假名生成?您可以通过这样的方案达成公平的妥协:
如果这样做,有两种主要的攻击途径可以通过假名获取真实身份。
假名数据集是notoriously vulnerable到信息融合攻击——你必须去除或“模糊”很多关键的相关信息以使数据集抵抗这种攻击,但你需要去除多少是topic of current research .
关于logging - 如何在不破坏新旧数据关系的情况下匿名化新日志记录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/851481/
在什么情况下我们应该在 JDK 8 中使用旧的 foreach 循环遍历新的 collection.forEach() 还是最好的做法是转换 every foreach 循环?是否存在任何重要的性能差
我想使用新的 CoraData 模型创建应用程序的新版本(由其他人创建)。我的疑问是:核心数据模型通过更新是永久的。我想确保以前的 CoreData 模型不会对新版本的应用程序产生问题。 我必须遵循一
我正在阅读“Dennis Ritchie 的 C 编程语言”,并且在一开始它演示了一个代码,即以下 #include main() { printf("Hello, World"); } 根据本书,这
首先,我知道这个问题在过去几年中在 Stack Overflow 上被提出过几次。问题是有时我会收到新的 PayPal 结帐页面,有时会收到旧页面。 我在沙盒中创建了两个测试帐户。第一个采用新设计,第
我在同一 Google Analytics(分析)帐户中有多个配置文件,但我发现新创建的配置文件的跟踪代码不同。它们会影响跟踪功能吗? 旧代码: var _gaq = _gaq || [];
我是一名优秀的程序员,十分优秀!