java - 如何在R语言tm(文本挖掘)包中使用stemDocument？-6ren

java - 如何在R语言tm(文本挖掘)包中使用stemDocument？

转载作者：行者123 更新时间：2023-12-04 06:12:28

25

4

我试图在调用 Java 的 R 语言 tm 包中使用 stemDocument 来阻止语料库。
我已经尝试过 tm 手册中的示例:

data("crude")
crude[[1]]
stemDocument(crude[[1]])

并得到以下错误:

Could not initialize the GenericProperitiesCreator.  This exception was produced:  
java.lang.NullPointerException

任何帮助表示赞赏。我对Java一无所知。

谢谢

最佳答案

好问题，你解决了吗？

我只有您拥有的代码也遇到了同样的错误。但是，如果您从一开始就遵循该示例(即在标题“p. 1 上的转换”处)并创建一个语料库并将其转换为纯文本文档，那么您就可以避免 Java 错误。我猜 manual 中的代码示例假设您已经完成了这两个步骤。

也就是说，当我检查结果时，没有实际的词干...我什至无法得到@user813966 的 simple example的 stemDocument 进行任何词干提取。我正在查看 RStem 和 SnowBall 包。

与此同时，python package NLTK是我的词干提取工具。

更新 :我通过添加 language = "english" 使 stemDocument 功能正常工作如下:

a <- tm_map(a, stemDocument, language = "english")

因此，您的问题的完整答案是按照 tm 包执行将文本输入 R 的所有步骤。您还需要 rJava(如果您在 Windows 中工作，还需要将 JAVA_HOME 的环境变量设置为包含 jre 目录的目录)以使 stemDocument 工作

关于java - 如何在R语言tm(文本挖掘)包中使用stemDocument？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7620449/

25

4

0

文章推荐： java - hibernate :在更新中选择

文章推荐： reference - 在哪里可以找到 CG 着色器语言的引用？

文章推荐： google-app-engine - GAE session : Where is settings. py？

javascript - 挖掘 JavaScript 对象的路径
我正在尝试提取 MultiLevelPushMenu 插件中当前元素的根路径。 https://github.com/adgsm/multi-level-push-menu 所有者给出了将根级路径提取
sql-server - 用于检查/挖掘 SQL 分析服务挖掘模型的前端应用程序
我目前使用 Excel 和 SQL Server 商业智能工作室来浏览我的模型，但我一直在寻找一个体面的、中等用户友好的前端应用程序，可用于通过 SSAS 挖掘模型跋涉。我了解如何将预测用于特定目的
gcc 可以对未知的迭代次数进行循环优化( strip 挖掘/阻塞)吗？
我正在尝试使用 GCC >= 4.4 中可用的 Graphite 循环优化框架，但如果迭代次数未知，我似乎无法让它应用任何转换。例如。这个示例代码: int __attribute__((hot))
python - 如何使用 awk、Perl 或 Python 挖掘 XML 文档？
我有一个具有以下数据格式的 XML 文件: .... 谁能告诉我如何使用 awk 单行程序对 XML 文件进行数据挖掘？例如，我想知道 abc 的 attr3。它会返回 345 给我。最佳答案
Azure Active Directory - 从 JWT token 挖掘 oAuth2Permission、appRole 和组声明
场景:我在不同的 Azure 租户中有 2 个 AAD 应用程序 - 让我们调用租户 A 和 B。租户 A 中的应用程序定义了租户 B 中的应用程序已同意的自定义 appRole 和 oAuth2Pe
Azure Active Directory - 从 JWT token 挖掘 oAuth2Permission、appRole 和组声明
场景:我在不同的 Azure 租户中有 2 个 AAD 应用程序 - 让我们调用租户 A 和 B。租户 A 中的应用程序定义了租户 B 中的应用程序已同意的自定义 appRole 和 oAuth2Pe

首页

博学

6Ren·AI

商城

java - 如何在R语言tm(文本挖掘)包中使用stemDocument？