- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 RTextTools 附带的德语词干分析器,但我得到的结果非常不合适。
说,我有以下向量:
v <- c("groß", "größer", "am", "größten", "ähnlicher")
library(RTextTools)
wordStem(v, "german")
[1] "groß" "größer" "am" "größten" "ähnlich"
最佳答案
Snowball 中的算法
/*
Extra rule for -nisse ending added 11 Dec 2009
*/
routines (
prelude postlude
mark_regions
R1 R2
standard_suffix
)
externals ( stem )
integers ( p1 p2 x )
groupings ( v s_ending st_ending )
stringescapes {}
/* special characters (in ISO Latin I) */
stringdef a" hex 'E4'
stringdef o" hex 'F6'
stringdef u" hex 'FC'
stringdef ss hex 'DF'
......
First, replace ß by ss, and put u and y between vowels into upper case.
Put u and y between vowels into upper case, and then do the following mappings,
(a) replace ß with ss, **"MAYBE WRONG ORDER"**
(a) replace ae with ä,
(a) replace oe with ö,
(a) replace ue with ü unless preceded by q.
So in quelle, ue is not mapped to ü because it follows q, and in feuer it is not mapped because the first part of the rule changes it to feUer, so the u is not found.
关于r - RTextTools 中的德语词干分析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10955521/
我正在尝试使用 RTextTools 附带的德语词干分析器,但我得到的结果非常不合适。 说,我有以下向量: v <- c("groß", "größer", "am", "größten", "ähn
我是 R 文本处理的新手。我正在尝试下面的简单代码 library(RTextTools) texts <- c("This is the first document.", "This is the
使用 tm 包,我可以这样做: c0 <- Corpus(VectorSource(text)) c0 <- tm_map(c0, removeWords, c(stopwords("english"
我正在创建一个 DocumentTermMatrix使用 create_matrix()来自 RTextTools 并创建 container和 model基于此。它适用于非常大的数据集。 我为每个类
我正在运行 RTextTools 包来构建文本分类模型。 当我准备预测数据集并尝试将其转换为矩阵时。我得到的错误是: Error in if (attr(weighting, "Acronym") =
我尝试将文本文档分为多个类别。我的下面的代码工作正常 matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",re
我正在尝试使用 R 中的 RTextTools 库创建文本分类器。训练和测试数据帧的格式相同。它们都由两列组成:第一列是文本,第二列是标签。 到目前为止我的程序的最小可重现示例(替换数据): # Pa
我有以下训练集: Text,y MRR 93345,1 MRR 93434,1 MRR 93554,1 MRR 938900,1 MRR 93970,1
我试图为 R 安装 RTextTools 包,但失败了。这是屏幕的输出 > > install.packages("RTextTools") Warning in install.packages(
我正在使用 RTextTools 来训练和分类来自 MySQL 表的数据。我有一个名为 id 的字段,用于标识数据库中的每个文档。但是,使用以下代码后,id 字段不再存在。 matrix <- cre
包“RTextTools”在函数 create_matrix() 中有一个已知错误。以下帖子显示了如何使用以下内容解决单个 R-Session 的问题 Fix .但是,该帖子仅说明如何通过 trace
对于这种分类方法,rtexttools 或其他软件包是否有任何替代方案,因为这些软件包已被删除,maxent 和 glmnet 也被删除,它们依赖于 rtexttools,反之亦然;这是我尝试应用和分
我是一名优秀的程序员,十分优秀!