- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
<分区>
不确定如何正确表达这个问题,但这是我打算使用下面概述的假设场景实现的 -
用户给我的电子邮件只有主题和正文,主题是电子邮件的主题,正文是对主题的描述,最多 1000 字的一段。现在我想使用某种计算机语言(可能是 python)分析这个段落(在 BODY 中),然后列出该段落中与 SUBJECT 字段中提到的主题相关的最重要的单词列表。
例如,如果电子邮件的主题是 iPhone,正文是“iPhone 以超高分辨率和图形重新定义了用户界面设计。它完全支持触摸并允许用户滑动屏幕”
所以我正在寻找的结果是一种列表,其中包含与 iPhone 相关的段落中的关键术语。示例 -(用户界面、设计、分辨率、图形、触摸、滑动、屏幕)。
所以基本上我正在考虑从段落中挑选最相关的词。我不确定我可以使用什么或如何使用来达到这个结果。在谷歌上搜索,我阅读了一些关于自然语言处理、python 和分类等的内容。我只需要一个通用的方法来解决这个问题——使用什么技术/语言,我必须阅读哪个领域等等。
谢谢!
EDIT:::
我一直在读书。准确地说,我正在研究如何使用什么工具来做到这一点:
使用 NLP 根据同义词、形态相似性、拼写错误和上下文分析从文本正文中生成相关标签。
我即将将主干中的某些修订合并到发布分支中。我用 mergeinfo 检查了有多少修订符合合并条件,结果是 42。尽管检查每个修订日志并决定是否应该合并它绝对是可能的并且不太难。然后,我将使用 Tort
我有 5 个文件夹,每个文件夹包含大小为 10KB、500KB、1MB、5MB 和 30MB 的“n”个文件。现在我需要从这些文件夹中选择正好 15000 个文件并将它们放入一个新文件夹中,这样我就可
嗨,我已经成功解析了一个以公里为单位的距离的 XML 文件。但结果我得到了源距离列表,但列表中的最后一个元素包含列表中所有其他元素的总和。如何获取列表中的最后元素 一些源代码: for(int s=0
我正在尝试修剪它,它存储在一个名为 $line 的变量中。 [2012-06-18 10:37:09,026 (there is a lot of text after this, i just cu
我正在使用 Python Selenium 绑定(bind)并测试网络服务器。我试图断言文本“回归”和“回归测试”的存在。有谁知道如何做吗?这是我在检查我感兴趣的元素时看到的内容: Regressi
我是一名优秀的程序员,十分优秀!