- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想就分配给我的一个有趣问题提供一些意见。任务是分析数百个甚至数千个隐私政策并确定它们的核心特征。例如,他们是否获取用户的位置?他们是否与第三方共享/出售?等等。
我和一些人交谈过,阅读了很多有关隐私政策的内容,并且自己也思考过这个问题。这是我当前的攻击计划:
首先,阅读大量隐私内容并找到满足特定特征的主要“线索”或指标。例如,如果数百个隐私政策都有相同的内容:“我们将获取您的位置。”,则该行可能是 100% 确信该隐私政策包含获取用户位置的提示。其他线索对某个特征的置信度要小得多。例如,“位置”一词的存在可能会将用户位置存储的可能性增加 25%。
我们的想法是不断开发这些线索及其适当的置信区间,直到我可以高度自信地对所有隐私政策进行分类。这里可以与垃圾邮件捕获系统进行类比,该系统使用贝叶斯过滤器来识别哪些邮件可能是商业邮件和未经请求的邮件。
我想问你们是否认为这是解决这个问题的好方法。您究竟会如何解决这样的问题?此外,是否有您推荐使用的特定工具或框架。欢迎任何意见。这是我第一次做一个涉及人工智能,特别是机器学习和NLP的项目。
最佳答案
The idea would be to keep developing these cues, and their appropriate confidence intervals to the point where I could categorize all privacy policies with a high degree of confidence. An analogy here could be made to email-spam catching systems that use Bayesian filters to identify which mail is likely commercial and unsolicited.
这是text classification 。鉴于每个文档有多个输出类别,它实际上是 multilabel classification 。标准方法是 manually label一组包含您想要预测的类/标签的文档,然后根据文档的特征训练分类器;通常是单词或 n-gram 出现次数或计数,可能由 tf-idf 加权。
流行的文档分类学习算法包括朴素贝叶斯和线性支持向量机,尽管其他分类器学习器也可能起作用。任何分类器都可以通过 one-vs.-rest 扩展为多标签分类器(OvR)构建。
关于language-agnostic - 有趣的NLP/机器学习风格项目——分析隐私政策,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9709293/
我读了 Douglas Crockford 所著的《JavaScript:The Good Parts》一书以及许多其他资源,但我对在 Javascript 中实现继承和隐私有(private)点困惑
假设我有两个包: with Ada.Streams; use Ada.Streams; package P is type SEA is new Stream_Element_Array (1.
我正在使用此代码在youtube上上传视频。 - (void)sendVideoFileMetadata:(NSDictionary *)videoMetadata
我开发了基于位置的应用程序,它能够获取用户的位置,但其中有一些奇怪的事情。在设置->隐私->位置服务下,它没有显示我的应用程序。对于它所展示的其他设备,只有 iPhone 6 Plus 才会出现这种情
我已经在我的 iOS 项目中添加了一个 sqlite 数据库,我希望它是私有(private)的,我不希望任何用户看到里面的内容。但是一旦创建了 .ipa 文件,如果我将其扩展名更改为 .zip 并查
我不确定这个标题是否合适。 让我描述一下我的想法。 我不熟悉 facebook API。 你看,我在网站上有这个页面。我希望这个页面只对我在 Facebook 上的 friend 可见。有什么办法可以
我正在使用 phonegap 制作应用程序,当用户不允许某个权限(例如 GPS)时,应用程序下次使用该功能时不会再次询问,我认为我能做的最好只是显示这样的消息: 请转至 iOS 设置 > 隐私 > 定
我是 iPhone 开发人员和 CFUUID 概念的新手,所以我想在开始实现它之前我应该问一下。所以 CFUUID 返回的字符串是否真的是唯一的,或者是否可以追溯到唯一的个体。意思是,我生成一个
我正在做一个项目,客户提出了一些有趣的要求。想知道是否有人有任何建议或想权衡。 我正在为我的客户创建一个 Web 应用程序,以便在公司内部分发给少数人。他们需要能够从世界任何地方访问 Web 应用程序
我正在使用 ggplot 和 plotly 绘制图表。如何在 plotly 上将 plotly 设为私有(private)而不是公开?我的代码如下所示: a <- ggplot(data, aes(v
修改我的Caddyfile在此平台上尝试推荐后...我仍然无法获得 我浏览器中的HTTPS连接。Chrome一直在说 “Your connection is not private Attackers
下面的代码不能再工作了,我们能做什么 [[UIApplication sharedApplication] openURL:[NSURL URLWithString: @"prefs:root=LOC
在应用程序 Info.plist 文件中设置 Privacy - Location Default Accuracy Reduced 然后调用 locationManager.requestWhenI
我正在开发需要从“系统偏好设置”>“安全和隐私”>“隐私”>“辅助功能”启用的应用程序。 现在,我正在使用以下代码打开下面屏幕截图中显示的窗口: -(IBAction)enableAccessibil
总的来说,我非常努力尊重模块的隐私(如果变量以下划线为前缀,我不会使用它)。然而,我有一个极端的情况,它看起来相当“安全”。 这是演示 ( my previous question ) parser=
我正在使用适用于 Android 的 Facebook SDK 3 在我的墙上分享状态。我授权我的所有 friend 都可以看到该发布,该帖子发布得很好,但即使有隐私,也没有人能看到它:公共(publ
在我的应用程序中,我直接获取联系信息购买这样做... ABAddressBookRef m_addressbook = ABAddressBookCreate(); CFArrayRef allPeo
是否有任何可能的方法来跟踪 Chrome 扩展程序从网站发出的网络通信? 假设 Chrome“内容脚本”扩展程序将 AJAX 查询发送到指定 IP 上的服务器以创建自定义分析。当用户浏览各种网站时,此
有件事一直困扰着我,就像人们意识到了我没有意识到的事情一样。我正在看一个 FOSS 示例(下面进行了简化)...每当我有一个 JavaScript 类时,我更喜欢 Crockford 的变量隐藏方法:
如果 locationServicesEnabled 返回 false,我会提示用户启用他们的定位服务。以下 URL 适用于 10.0+,将用户重定向到“设置”应用并直接转到“定位服务”屏幕: URL
我是一名优秀的程序员,十分优秀!