- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 data.frame
,其中包含周数 week
和文本评论 text
。我想将 week
变量视为我的分组变量,并对它运行一些基本的文本分析(例如 qdap::polarity
)。一些评论文本有多个句子;但是,我只关心本周的“整体”极性。
如何在运行 qdap::polarity
之前将多个文本转换链接在一起并遵守其警告消息?我能够将转换与 tm::tm_map
和 tm::tm_reduce
链接在一起——在 qdap
中有类似的东西吗?在运行 qdap::polarity
和/或 qdap::sentSplit
之前预处理/转换此文本的正确方法是什么?
以下代码/可重现示例中的更多详细信息:
library(qdap)
library(tm)
df <- data.frame(week = c(1, 1, 1, 2, 2, 3, 4),
text = c("This is some text. It was bad. Not good.",
"Another review that was bad!",
"Great job, very helpful; more stuff here, but can't quite get it.",
"Short, poor, not good Dr. Jay, but just so-so. And some more text here.",
"Awesome job! This was a great review. Very helpful and thorough.",
"Not so great.",
"The 1st time Mr. Smith helped me was not good."),
stringsAsFactors = FALSE)
docs <- as.Corpus(df$text, df$week)
funs <- list(stripWhitespace,
tolower,
replace_ordinal,
replace_number,
replace_abbreviation)
# Is there a qdap function that does something similar to the next line?
# Or is there a way to pass this VCorpus / Corpus directly to qdap::polarity?
docs <- tm_map(docs, FUN = tm_reduce, tmFuns = funs)
# At the end of the day, I would like to get this type of output, but adhere to
# the warning message about running sentSplit. How should I pre-treat / cleanse
# these sentences, but keep the "week" grouping?
pol <- polarity(df$text, df$week)
## Not run:
# check_text(df$text)
最佳答案
您可以按照警告中的建议运行 sentSplit
,如下所示:
df_split <- sentSplit(df, "text")
with(df_split, polarity(text, week))
## week total.sentences total.words ave.polarity sd.polarity stan.mean.polarity
## 1 1 5 26 -0.138 0.710 -0.195
## 2 2 6 26 0.342 0.402 0.852
## 3 3 1 3 -0.577 NA NA
## 4 4 2 10 0.000 0.000 NaN
请注意,我有一个突破情绪包 sentimentr在 github 上可用,与 qdap 版本相比,它在速度、功能和文档方面都有所改进。这会在 sentiment_by
函数内部进行句子拆分。下面的脚本允许您安装并使用该包:
if (!require("pacman")) install.packages("pacman")
p_load_gh("trinker/sentimentr")
with(df, sentiment_by(text, week))
## week word_count sd ave_sentiment
## 1: 2 25 0.7562542 0.21086408
## 2: 1 26 1.1291541 0.05781106
## 3: 4 10 NA 0.00000000
## 4: 3 3 NA -0.57735027
关于r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34023200/
我正在使用reactjs-popup,它的 Prop 之一是contentStyle,它允许您传递css-in-js对象来设置库中内部div的样式。 但是,当我传递带有 @media 的 css 对象
在查看了一些服务/工具之后,我得出了一个结论。大多数 Text-to-Speech 工具的技术含量太高、太机械化——换句话说,就是质量差的 c 语音。 是的,最重要的是,看起来它们带有“硬编码”语音模
我正在尝试使用 Emotion.sh在我的 React 测试元素中,但我使用与 example 中相同的代码得到以下错误 需要考虑的可能有冲突的事情:1、之前用的是npm,现在用的是yarn;2. 我
通过以下链接,我有了一些想法。我想问问我是做对了还是做错了。如果我走错了路,请指导我。 链接 Using libsvm for text classification c# How to use li
以下设置不显示background-image。作为调试步骤,我尝试在 const background 中设置 background: pink,这确实有效,确认 emotion 正在正确运行。 打
我有一个 data.frame,其中包含周数 week 和文本评论 text。我想将 week 变量视为我的分组变量,并对它运行一些基本的文本分析(例如 qdap::polarity)。一些评论文本有
我正在研究 Kaggle 电影情感分析,我发现电影评论已使用 Standford Parser 进行了解析。在探索数据集时,我发现相同的语句给出了不同的设置- their parents , wise
我正在尝试使用Affectiva emotion sdk 制作一个演示程序。但是,当我调用 detector.setLicensePath() 时,会抛出一个异常(见下图)。有谁知道如何解决这个问题?
我想设置一个使用 Material-UI v4.11.4 的 Typescript 项目来使用情感进行样式设置,为 MUI v5 版本做准备。目标是在项目中引入情感,以便开发人员可以开始使用新样式,而
我是一名优秀的程序员,十分优秀!