r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析-6ren

r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析

转载作者：行者123 更新时间：2023-12-05 06:43:16

25

4

我有一个 data.frame，其中包含周数 week 和文本评论 text。我想将 week 变量视为我的分组变量，并对它运行一些基本的文本分析(例如 qdap::polarity)。一些评论文本有多个句子；但是，我只关心本周的“整体”极性。

如何在运行 qdap::polarity 之前将多个文本转换链接在一起并遵守其警告消息？我能够将转换与 tm::tm_map 和 tm::tm_reduce 链接在一起——在 qdap 中有类似的东西吗？在运行 qdap::polarity 和/或 qdap::sentSplit 之前预处理/转换此文本的正确方法是什么？

以下代码/可重现示例中的更多详细信息:

library(qdap)
library(tm)

df <- data.frame(week = c(1, 1, 1, 2, 2, 3, 4),
                 text = c("This is some text. It was bad. Not good.",
                          "Another review that was bad!",
                          "Great job, very helpful; more stuff here, but can't quite get it.",
                          "Short, poor, not good Dr. Jay, but just so-so. And some more text here.",
                          "Awesome job! This was a great review. Very helpful and thorough.",
                          "Not so great.",
                          "The 1st time Mr. Smith helped me was not good."),
                 stringsAsFactors = FALSE)

docs <- as.Corpus(df$text, df$week)

funs <- list(stripWhitespace,
             tolower,
             replace_ordinal,
             replace_number,
             replace_abbreviation)

# Is there a qdap function that does something similar to the next line?
# Or is there a way to pass this VCorpus / Corpus directly to qdap::polarity?
docs <- tm_map(docs, FUN = tm_reduce, tmFuns = funs)


# At the end of the day, I would like to get this type of output, but adhere to
# the warning message about running sentSplit. How should I pre-treat / cleanse
# these sentences, but keep the "week" grouping?
pol <- polarity(df$text, df$week)

## Not run:
# check_text(df$text)

最佳答案

您可以按照警告中的建议运行 sentSplit，如下所示:

df_split <- sentSplit(df, "text")
with(df_split, polarity(text, week))

##   week total.sentences total.words ave.polarity sd.polarity stan.mean.polarity
## 1    1               5          26       -0.138       0.710             -0.195
## 2    2               6          26        0.342       0.402              0.852
## 3    3               1           3       -0.577          NA                 NA
## 4    4               2          10        0.000       0.000                NaN

请注意，我有一个突破情绪包 sentimentr在 github 上可用，与 qdap 版本相比，它在速度、功能和文档方面都有所改进。这会在 sentiment_by 函数内部进行句子拆分。下面的脚本允许您安装并使用该包:

if (!require("pacman")) install.packages("pacman")
p_load_gh("trinker/sentimentr")

with(df, sentiment_by(text, week))

##    week word_count        sd ave_sentiment
## 1:    2         25 0.7562542    0.21086408
## 2:    1         26 1.1291541    0.05781106
## 3:    4         10        NA    0.00000000
## 4:    3          3        NA   -0.57735027

关于r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34023200/

25

4

0

文章推荐： asp.net-mvc - Web.Config - staticContent - clientCache 配置

文章推荐： django - 将模型选择限制为自引用

文章推荐： php - mysqli_stmt::execute() 需要 0 个参数，1 个给定错误

文章推荐： WPF - 在 xaml 中完成另一个动画后开始动画

javascript - 情感 - 将样式对象传递到外部库
我正在使用reactjs-popup，它的 Prop 之一是contentStyle，它允许您传递css-in-js对象来设置库中内部div的样式。但是，当我传递带有 @media 的 css 对象
audio - 高质量，情感，流畅和可变的文本到语音引擎？
在查看了一些服务/工具之后，我得出了一个结论。大多数 Text-to-Speech 工具的技术含量太高、太机械化——换句话说，就是质量差的 c 语音。是的，最重要的是，看起来它们带有“硬编码”语音模
css - 情感 css 样式使用与示例相同的代码给我错误
我正在尝试使用 Emotion.sh在我的 React 测试元素中，但我使用与 example 中相同的代码得到以下错误需要考虑的可能有冲突的事情:1、之前用的是npm，现在用的是yarn；2. 我
svm - 训练 libsvm 进行文本分类(情感)
通过以下链接，我有了一些想法。我想问问我是做对了还是做错了。如果我走错了路，请指导我。链接 Using libsvm for text classification c# How to use li
javascript - Gatsby 设置背景图像 CSS-In-JS(情感)
以下设置不显示background-image。作为调试步骤，我尝试在 const background 中设置 background: pink，这确实有效，确认 emotion 正在正确运行。打
r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析
我有一个 data.frame，其中包含周数 week 和文本评论 text。我想将 week 变量视为我的分组变量，并对它运行一些基本的文本分析(例如 qdap::polarity)。一些评论文本有
python - Stanford NLP Parser 对 Kaggle Movie 评论中使用的相同语句给出不同的结果(情感)
我正在研究 Kaggle 电影情感分析，我发现电影评论已使用 Standford Parser 进行了解析。在探索数据集时，我发现相同的语句给出了不同的设置- their parents , wise
c++ - Affectiva 情感 SDK - 调用 .setLicensePath() 和 setClassifierPath() 时抛出异常
我正在尝试使用Affectiva emotion sdk 制作一个演示程序。但是，当我调用 detector.setLicensePath() 时，会抛出一个异常(见下图)。有谁知道如何解决这个问题？
reactjs - 无法让 Typescript 理解 Material-UI 组件上的 css Prop (情感)
我想设置一个使用 Material-UI v4.11.4 的 Typescript 项目来使用情感进行样式设置，为 MUI v5 版本做准备。目标是在项目中引入情感，以便开发人员可以开始使用新样式，而

首页

博学

6Ren·AI

商城

r - 如何将多个 qdap 转换链接在一起以进行 R 中的文本挖掘/情感(极性)分析