regex - R 正则表达式错误 :java. lang.NoSuchMethodException 中的 Mallet:给定参数没有合适的方法-6ren

regex - R 正则表达式错误 :java. lang.NoSuchMethodException 中的 Mallet:给定参数没有合适的方法

转载作者：行者123 更新时间：2023-12-01 09:57:29

26

4

我一直在学习如何在 R 中使用 mallet 创建主题模型的教程。我的文本文件每行 1 个句子。它看起来像这样，大约有 50 个句子。

Thank you again and have a good day :).
This is an apple.
This is awesome!
LOL!
i need 2.
.
.
.

这是我的代码:

Sys.setenv(NOAWT=TRUE)

#setup the workspace
# Set working directory
dir<-"/Users/jxn"
Dir <- "~/Desktop/Chat/malletR/text" # adjust to suit
require(mallet)
documents1 <- mallet.read.dir(Dir)
View(documents1)
stoplist1<-mallet.read.dir("~/Desktop/Chat/malletR/stoplists")
View(stoplist1)
**mallet.instances <- mallet.import(documents1$id, documents1$text, "~/Desktop/Chat/malletR/stoplists/en.txt", token.regexp ="\\p{L}[\\p{L}\\p{P}]+\\p{L}")**

除了最后一行代码，一切正常

**`**mallet.instances <- mallet.import(documents1$id, documents1$text, "~/Desktop/Chat/malletR/stoplists/en.txt", token.regexp ="\\p{L}[\\p{L}\\p{P}]+\\p{L}")**`**

我一直收到这个错误:

Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl,  : 
  java.lang.NoSuchMethodException: No suitable method for the given parameters

根据包，函数应该是这样的:

mallet.instances <- mallet.import(documents$id, documents$text, "en.txt",
                    token.regexp = "\\p{L}[\\p{L}\\p{P}]+\\p{L}")

我相信它与 token.regexp 参数有关
documents1 <- mallet.read.dir(Dir)工作正常，这意味着提供给 mallet.instances 的前 3 个参数是正确的。

这是我从中学习教程的 git 存储库的链接。 https://github.com/shawngraham/R/blob/master/topicmodel.R

任何帮助将不胜感激。

谢谢，J

最佳答案

我怀疑问题出在您的文本文件上。我遇到了同样的错误并使用 as.character() 解决了它功能如下:

mallet.instances <- mallet.import(as.character(documents$id), as.character(documents$text), "en.txt", FALSE, token.regexp="\\p{L}[\\p{L}\\p{P}]+\\p{L}")

关于regex - R 正则表达式错误 :java. lang.NoSuchMethodException 中的 Mallet:给定参数没有合适的方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22878215/

26

4

0

文章推荐： clojure - conj 的奇怪行为

文章推荐： multidimensional-array - AWK 中的数据透视表

mallet - 如何在 mallet 中使用 --use-ngrams
我想使用 --use-ngrams true 选项运行 mallet，但似乎无法正常工作。 bin\mallet import-file --input ovary.txt --output ovar
python mallet LDA FileNotFoundError : [Errno 2] No such file or directory: 'C:\\Users\\abc\\AppData\\Local\\Temp\\d33563_state.mallet.gz'
这是我第一次使用槌 LDA。基本上，我下载了 mallet-2.0.8 zip 文件和 JDK。我安装了 JDK，将 mallet-2.0.8 提取到目标文件夹。我设置了 MALLET_HOME。这是
java - Mallet:字母不匹配异常
我尝试使用 Java 中的 Mallet 实现文档分类器。我已经有一个基本包含特征值的文件。所以我不想运行整个 raw text 处理管道。目前我的特征文件中的一行看起来像这样(2 个特征，ID 和
java - Mallet 未被识别为内部或外部命令
我使用的是 Windows 7。我安装了 Mallet，当我进入 Mallet 目录时它运行得很好。但是，我正在使用一些调用它的 python 软件( https://github.com/uwgra
java - Mallet:对每个预测的贡献
我正在使用 CRF 在 Mallet 上开发一个 NER 系统。您知道是否可以收集每个预测的特征贡献吗？我需要知道并理解 CRF 模型的精确行为。有什么建议吗？谢谢。干杯，乌克兰最佳答案是
java - MALLET:如何实现基于crf的编辑距离？
我正在寻找有人写/知道MALLET类的详细信息。我知道这是解决ML问题的好工具，现在我尝试实现此处Andrew McCallum, Kedar Bellare and Fernando Pereira
r - 如何通过重组 MALLET 输出文件来创建表格？
我正在使用 MALLET 进行主题分析，它在几千行和一百左右行的文本文件(“topics.txt”)中输出结果，其中每行由制表符分隔的变量组成，如下所示: Num1 text1 topic1 prop
nlp - 使用 Mallet 加载模型和分类输入
我已经有一个使用 SimpleTagger 训练过的 CRF 训练模型。 SimpleTagger.main(new String[] { "--tra
nlp - 关于潜在狄利克雷分配(MALLET)的问题
老实说，我对 LDA 并不熟悉，但我的一个项目需要使用 MALLET 的主题建模。我的问题是:给定特定时间戳内的一组文档作为主题模型的训练数据，使用模型(使用推理器)来跟踪主题趋势是否合适，对于文档
java - MALLET 主题建模 OutOfMemoryError
我使用 MALLET 进行主题建模。 http://mallet.cs.umass.edu/topics.php 首先，我尝试按照说明导入培训文档集。 bin/mallet import-dir --
java - 更改 MALLET 中主题分发文件中的列顺序
MALLET 在训练主题模型时使用 --output-doc-topics 参数生成一个制表符分隔的文件，其中包含每个文档的主题分布。它看起来像这样: doc# filename topi
java - Mallet 文档分类 - 减少词汇量
我用 Mallet 训练了 maxent 文档分类模型，结果是 130MB，这对于我希望运行它的实例来说太大了。我想知道是否有一种方法可以潜在地减少模型的词汇量，从而减少整体模型的大小。有管道可以做到
java - 获取 mallet 中所有文档的实例和主题序列
我正在使用 mallet 库进行主题建模。我的数据集位于 filePath 路径中，并且 csvIterator 似乎可以读取数据，因为 model.getData() 有大约 27000 行，等于我
Java Mallet LDA 关键字分布
我使用 Java-Mallet API 通过 LDA 进行主题建模。 API 产生以下结果:主题:关键字1(计数)、关键字2(计数) 例如主题 0:文件 (12423)、测试 (3123) ...主
java - 无法运行 Mallet 主题模型
我正在尝试运行 Mallet 的主题建模，但出现以下错误: Couldn't open cc.mallet.util.MalletLogger resources/logging.properties
classification - 在 mallet 中训练分类器
我有一个格式如下的 csv 文件产品名称，产品评论现在使用 mallet 我必须训练分类器，以便如果输入包含产品评论的测试数据集，它应该告诉我特定评论属于哪个产品 mallet java api
java - 如何使用 Mallet 进行序列标记任务？
我正在尝试将 mallet 包合并到我的 java 代码中以完成我的序列标记任务。但是，我不太确定我应该如何仅根据 mallet 网站上的数据导入指南进行操作。谁能帮我解决这个问题？我的第一个问题是
java - Mallet 特征选择类似于将特征值设置为 0
我正在查看 Mallet 源代码，似乎大多数分类器实现(例如朴素贝叶斯)并没有真正考虑到功能选择，即使 InstanceList 类具有setFeatureSelection 方法。现在我想对我的数
machine-learning - Mallet 训练模型负载
有人有幸加载过之前训练过的模型吗？翻阅其API ，CRFWriter类是拼图的1/2，但是你到底如何CRFRead(类不存在) 感谢您的帮助。最佳答案根据您使用的训练器，您应该能够将对象转换为 C
nlp - 为什么使用 MALLET 主题推断对单个文档和批量文档会得到不同的结果？
我正在尝试使用 Mallet 2.0.7 执行 LDA 主题建模。从训练类(class)的输出来看，我可以训练 LDA 模型并获得良好的结果。此外，我可以使用该过程中内置的推理器，并在重新处理我的训练

首页

博学

6Ren·AI

商城

regex - R 正则表达式错误 :java. lang.NoSuchMethodException 中的 Mallet:给定参数没有合适的方法