- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图在调用 Java 的 R 语言 tm 包中使用 stemDocument 来阻止语料库。
我已经尝试过 tm 手册中的示例:
data("crude")
crude[[1]]
stemDocument(crude[[1]])
Could not initialize the GenericProperitiesCreator. This exception was produced:
java.lang.NullPointerException
最佳答案
好问题,你解决了吗?
我只有您拥有的代码也遇到了同样的错误。但是,如果您从一开始就遵循该示例(即在标题“p. 1 上的转换”处)并创建一个语料库并将其转换为纯文本文档,那么您就可以避免 Java 错误。我猜 manual 中的代码示例假设您已经完成了这两个步骤。
也就是说,当我检查结果时,没有实际的词干...我什至无法得到@user813966 的 simple example的 stemDocument 进行任何词干提取。我正在查看 RStem 和 SnowBall 包。
与此同时,python package NLTK是我的词干提取工具。
更新 :我通过添加 language = "english"
使 stemDocument 功能正常工作如下:
a <- tm_map(a, stemDocument, language = "english")
关于java - 如何在R语言tm(文本挖掘)包中使用stemDocument?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7620449/
我正在尝试提取 MultiLevelPushMenu 插件中当前元素的根路径。 https://github.com/adgsm/multi-level-push-menu 所有者给出了将根级路径提取
我目前使用 Excel 和 SQL Server 商业智能工作室来浏览我的模型,但我一直在寻找一个体面的、中等用户友好的前端应用程序,可用于通过 SSAS 挖掘模型跋涉。 我了解如何将预测用于特定目的
我正在尝试使用 GCC >= 4.4 中可用的 Graphite 循环优化框架,但如果迭代次数未知,我似乎无法让它应用任何转换。例如。这个示例代码: int __attribute__((hot))
我有一个具有以下数据格式的 XML 文件: .... 谁能告诉我如何使用 awk 单行程序对 XML 文件进行数据挖掘?例如,我想知道 abc 的 attr3。它会返回 345 给我。 最佳答案
场景:我在不同的 Azure 租户中有 2 个 AAD 应用程序 - 让我们调用租户 A 和 B。租户 A 中的应用程序定义了租户 B 中的应用程序已同意的自定义 appRole 和 oAuth2Pe
场景:我在不同的 Azure 租户中有 2 个 AAD 应用程序 - 让我们调用租户 A 和 B。租户 A 中的应用程序定义了租户 B 中的应用程序已同意的自定义 appRole 和 oAuth2Pe
我是一名优秀的程序员,十分优秀!