- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我的任务是尝试创建一个从文本文档中删除个人信息的自动化系统。
电子邮件、电话号码相对容易删除。名字不是。这个问题很难,因为文档中有需要保留的名称(例如,引用资料、名人、人物等)。需要从内容中删除作者姓名(也可能有多个作者)。
目前我想到了以下几点:
有什么想法吗?有人已经解决了这个问题吗??
最佳答案
使用当前技术,不可能以完全自动化的方式以低错误率执行您所描述的操作。
或许可以想出一个近似解,但它仍然会产生很多错误......要么是误报,要么是漏报,要么是两者的某种组合。
如果您仍然下定决心要尝试,我认为最好的方法是贝赛尔过滤 (as used in spam filtering)。这样做的原因是它非常擅长根据单词的相对位置和频率分配概率,并且还可以了解哪些名字更有可能/不太可能是名人等。
关于algorithm - 在文档中查找个人信息(难题),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5027801/
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章dede会员列表调用适用于企业、个人由作者收集整理,如果你对这篇文章有兴
如何在 MySQL 中创建个人组消息传递的消息对话架构。是否有可能创建以下场景。 已读/未读 如果用户删除对话不影响其他对话。(例如用户 A 和 B 有消息对话 A 清除消息,则 B 消息不应影响)
是否可以将一些数据存储在您的个人 github 页面的某个位置? 例如触发计数器的按钮。当您单击该按钮时,计数器会加 1。当其他用户访问该页面并单击该按钮时,计数器会再次加 1。 因此它将是页面上显示
我正在编写一个守护程序应用程序来使用 Outlook Mail REST API ( https://learn.microsoft.com/en-us/previous-versions/offic
我的电脑有两个外置声卡和一个在带有 windows vista 的主板上。在 Vista 中,它看到同一个声卡的两个实体,一个数字输出和一个模拟输出。 当我尝试播放带有数字音频的视频文件时,比如 dv
我有一个个人 Apple 开发者计划,我希望我的 friend 帮助我开发我的应用程序。我的 friend ,他自己有一个个人 Apple 开发者计划,所以他创建了一个新的 Apple ID,我将他的
我知道您可以编辑在 tumblr 博客上呈现所有帖子博客主页的 html/AngularJS。但是,有没有办法添加自定义 ...到个别职位?我想在逐个帖子的基础上做一些 javascript 的事情,
首先,我想提前感谢您在此问题上提供的任何帮助。 Valgrind下面粘贴的输出源自以下单行 C 代码。 for( j=i;jsize-1;j++ ) s3->delete_tail( s3 ); 但是
我有几个服务器在测试环境中运行我有一个 CA 并且可以认证一个页面。 是否可以为从我收到的 CA 派生的测试环境创建我自己的 CA? 最佳答案 您可以使用 java 开发工具 keytool 在将要运
我正在尝试实现 custom UITabbar . 我发现的任何东西都涉及在 tabbarItem 上覆盖一个矩形。那么有什么直接的方法可以做到这一点吗? 最佳答案 要更改单个 tabBar 项目的色
我读了git book但不知何故忘记了rule上面写着: Do not rebase commits that you have pushed to a public repository. If y
我在工作中使用 BitKeeper,我想在家里为自己做一个基本的代码备份(考虑到我很少备份) //我以前从未使用过 git,所以我需要很多帮助 我认为在我的家庭服务器上有一个 git 存储库可能是个好
我必须处理大量扫描的 ID,我需要从中提取照片以进行进一步处理。这是一个虚构的例子: 问题是扫描没有完全对齐(最多旋转 10 度)。所以我需要找到它们的位置,旋转它们并剪出照片。事实证明,这比我原先想
在下面的代码块中,有几个(故意的)错误,我的任务是找到它们并解释这些错误是否会导致编译代码时出现问题,或者至少会导致一些逻辑问题。 public class Person { private St
一个 friend 给了我这个问题作为挑战,我试图在 LeetCode 上找到这样的问题,但很遗憾没有找到。 问题 Given a line of people numbered from 1 to
我有一个绑定(bind)到 VSTS 的公司帐户,以及一个绑定(bind)到同一电子邮件地址但作为个人帐户的 Azure 帐户。 VSTS 帐户:[email protected] (公司账户) Az
我刚刚创建了一个新的 MVC 项目并创建了一个空 View 。我在尝试声明 View 的模型时编写了第一行代码,如下所示: @model Personal; 其中,personal 是实际存在的模型
我是Kotlin的新手,我尝试理解所示的交换两个变量值的简短代码。 我不明白为什么它和b在Also函数中具有不同的值。他们不使用十进制值2引用相同的内存地址吗? 谢谢。 var a = 1 var b
我正在尝试查询与类/个人相关的所有 AnnotationAssertion。 下面是我的来源片段: #Car
我们目前正在使用威瑞信的时间戳服务,但时间戳服务器时常变得不可用 - 主要是由于我们的 ISP 故障。 我们现在为我们构建的所有内容添加时间戳,甚至是简单的开发构建,因为我们在 Vista 中遇到了很
我是一名优秀的程序员,十分优秀!