gpt4 book ai didi

r - 为R中的不同特征分配权重

转载 作者:行者123 更新时间:2023-12-02 03:16:20 24 4
gpt4 key购买 nike

是否可以在用 R 制定 DFM 之前为不同的特征分配权重?

在 R 中考虑这个例子

str="苹果比香蕉好"
mydfm=dfm(str, ignoredFeatures = stopwords("english"), verbose = FALSE)

DFM mydfm 看起来像:

docs apple better banana
text1 1 1 1

但是,我想事先分配权重(苹果:5,香蕉:3),这样 DFM mydfm 看起来像:

docs apple better banana
text1 5 1 3

最佳答案

我不这么认为,但是你之后可以很容易地做到这一点:

library(quanteda)
str <- "apple is better than banana"
mydfm <- dfm(str, ignoredFeatures = stopwords("english"), verbose = FALSE)
idx <- which(names(weights) %in% colnames(mydfm))
mydfm[, names(weights)[idx]] <- mydfm[, names(weights)[idx]] %*% diag(weights[idx])
mydfm
# 1 x 3 sparse Matrix of class "dgCMatrix"
# features
# docs apple better banana
# text1 5 1 3

关于r - 为R中的不同特征分配权重,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36815926/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com