gpt4 book ai didi

r - 文档术语矩阵中的最大术语长度

转载 作者:行者123 更新时间:2023-12-04 11:56:43 25 4
gpt4 key购买 nike

想象一下由 tm 包创建的以下文档术语矩阵:

> frequencies
<<DocumentTermMatrix (documents: 255, terms: 470)>>
Non-/sparse entries: 7693/112157
Sparsity : 94%
Maximal term length: 10
Weighting : term frequency (tf)

什么是最大期限长度?

最佳答案

最大术语长度是文档术语矩阵中一个(或多个)术语的最大字符数。

示例:如果您在 dtm 中有 5 个单词,最长的术语是“编程”,则最大术语长度为 11。

text <- c("word1", "word2", "word3", "word4", "programming")
corp <- Corpus(VectorSource(text))
term <- DocumentTermMatrix(corp)
term

<<DocumentTermMatrix (documents: 5, terms: 5)>>
Non-/sparse entries: 5/20
Sparsity : 80%
Maximal term length: 11
Weighting : term frequency (tf)

关于r - 文档术语矩阵中的最大术语长度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48501599/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com