- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在为一个非营利组织开展一个项目,以帮助处理和分类每年来自世界各地的现场工作人员/承包商的 1000 份报告。我对 NLP 比较陌生,因此想就解决我们问题的方法寻求小组的指导。
我将重点介绍当前流程和我们面临的挑战,并希望您能以最佳方式解决我们的问题。
当前进程:现场官员以最佳做法的形式提交本地运行的项目的报告。然后,这些报告由全职策展人团队处理,他们 (i) 确保他们遵守最佳实践模板,以及 (ii) 编辑文档以改进语言/风格/语法。
挑战:随着现场工作人员数量的增加,生成的报告量也在增加,我们的编辑现在成为瓶颈。
解决方案:我们希望自动化流程的第一步,即检查文档是否符合组织最佳实践模板
基本上,我们需要确保每个报告都有 3 个组成部分,即:
1. 说明其目的:此最佳实践解决什么主题/问题?
2. 识别受众:这是给谁的?
3. 亮点相关性:读者阅读后能做什么?
这是一个很好的报告提交示例。
“本文件介绍了在发展中国家成功应用最佳做法的技术。这项研究旨在帮助低收入农民确定一套在价格不透明的地方为农产品定价的最佳做法。通过实现这些流程,农民将能够为他们的产品获得更好的价格并提高他们的家庭收入。”
到目前为止,我们的方法是使用 RegEx 并检查关键字。即,为了检查合规性,我们使用以下逻辑:
1 检查“状态目的”=我们做一个正则表达式来匹配“目的”、“意图”
2 检查“识别受众”=我们做一个正则表达式来匹配“识别”,“是为”
3 检查“突出显示相关性”=我们做一个正则表达式来匹配“能够”、“允许”、“启用”
目前 RegEx 的方法似乎非常原始和有限,所以我想问问社区是否有更好的方法来使用 NLTK、CoreNLP 之类的东西来解决这个问题。
提前致谢。
最佳答案
有趣的问题,我相信这是一个彻底的研究问题!在自然语言处理中,很少有技术可以从文本中学习和提取模板,然后将它们作为黄金注释来识别文档是否遵循模板结构。研究人员使用这种系统进行自动问答(从问题中提取模板然后回答它们)。但是在您的情况下,它更困难,因为您需要从报告中学习结构。鉴于自然语言处理,这更难解决您的问题(没有简单的 NLP 任务与您的问题定义匹配),并且您可能不需要任何花哨的模型(复杂)来解决您的问题。
您可以从简单的文档匹配和计算相似度分数开始。如果您有大量正面示例(格式良好且指定的报告),则可以基于 tf-idf 权重构建字典。然后您可以检查字典标记的存在。您也可以将此问题视为二元分类问题。有很好的机器学习分类器,例如 svm、逻辑回归,它们适用于文本数据。您可以使用 python 和 scikit-learn 快速构建程序,它们非常易于使用。对于文本预处理,您可以使用 NLTK。
由于报告将由现场工作人员生成,并且报告将回答的问题很少(您提到了 3 个特定组件),我想简单的关键字匹配技术将是您研究的良好开端。您可以根据您的观察逐渐移动到不同的方向。
关于nlp - 除了 RegEx 之外的其他技术在句子中发现 'intent',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40667782/
如果我想为收藏创建一个 Intent 。 如果用户问“他最喜欢什么”,它会显示一些建议芯片 因此它会调用与该芯片相关的任何后续 Intent 。 最喜欢的饮料 最喜欢的食物 最喜欢的电影等 我还想直接
我确信有一些显而易见的事情,但还没有找到解决这个简单问题的方法。错误是在用户猜出正确答案时尝试启动另一个 Activity 的主要 Activity : Error:(85, 23) Unresolv
public class MainActivity extends Activity { Button b; //FrameLayout fl; @Override p
我对 intentService 有点困惑。文档说,如果您向 intentService 发送多个任务( Intent ),那么它将在一个单独的线程上一个接一个地执行它们。我的问题是 - 是否可以同时
我正在尝试从其他应用程序获取 mime 类型 text/plain 的 Intent 并将该文本存储在字符串类型的变量中。它在 onCreate 方法中工作正常,但是当我使用 singleTask 作
我想知道,2个代码有什么区别? newIntent.setFlags(Intent.FLAG_ACTIVITY_NEW_TASK | Intent.FLAG_ACTIVITY_CLEAR_TOP);
如何设置我的 Activity 以响应任何类型的共享 Intent 。 我试过:- 但是这不起作用,我已经阅读了http://developer.android.co
鉴于子类具有不同的上下文以及在单击监听器后启动的不同 Activity ,父类(super class)中的代码 Intent Intent=new Intent(context,Activity.c
更新#1:更多信息添加到这篇文章的末尾 我是 Android 开发和测试的新手。 我有 3 个 Espresso 测试。第一个测试通过,但第二个不会运行,因为在第二个测试之前调用 setUp() 方法
我是 Espresso UI 测试的新手。 我在运行测试时遇到这个错误(ADT Eclipse IDE)。 该应用程序已经开发完成,并且在启动该应用程序时有很多请求正在进行。无法重写应用程序。但我需要
因此,尝试创建一个我认为是基本简历应用程序的应用程序。我有两个类(class),都有同样的问题。它说它“无法解析符号 Intent ” 谷歌部分做了,但没有任何意义.. 这是我的代码。 MainAct
我正在尝试将 user_id 值从一个 Intent 传递到另一个 Intent。我知道这是一个非常简单的过程,而且我已经这样做了好几次了。但对于下面的代码,我有点困惑。 我需要将 user_id 值
这是我将值传递给名为 choice 的类的主要 Activity 。 @Override public void onClick(View v) { // TODO Auto-generated me
我正在寻找一个 Android Intent 来翻译文本,我发现了这个: Google Translate Activity not working anymore 但我想在任务管理器中使用它。我真的
可以设置多个启动 Intent ,例如,当用户点击通知时。 让我解释一下我的具体问题: 我有一个带通知的应用程序。每个通知都会打开一个不同的 Activity (也有不同的附加功能)。 现在我想提取有
我有一个 Intent launchIntent = packageManagerForListener.getLaunchIntentForPackage(packagesForAdapter[po
List targetedShareIntents = new ArrayList(); Intent shareIntent = new Intent(android.content.Intent.
所以我试图在选择列表中的项目后启动一个新 Activity ......根据我所读的内容非常基本。我也在尝试在附加功能中发送一个值。所以我可以选择列表中的项目,然后新 Activity 开始,extr
有没有一种方法可以将一个Intent bundle 从一个 Intent 传递到另一个 Intent ,而不必提取包并单独处理每个额外的 Intent ? 例子: intent2.setExtras(
这个问题在这里已经有了答案: Android 5.0 (L) Service Intent must be explicit in Google analytics (11 个答案) 关闭 6 个月
我是一名优秀的程序员,十分优秀!