- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用渲染语句将 rmd 文件转换为 pdf。
render("MiningReport.Rmd", "pdf_document",output_dir = "C:/ProjectSocial/Reports/Twitter/Maybelline")
Quitting from lines 109-113 (MiningReport.Rmd)
Error in object[seq_len(ile)] :
object of type 'symbol' is not subsettable
```{r assoc ,echo=F,message=FALSE}
library(tm)
findAssocs(myTdm,df$term[1:10],0.5)
```
```{r computedate,echo = FALSE}
date1 <-format(Sys.Date() - 7,"%B %d")
date2 <-format(Sys.Date() - 1,"%B %d, %Y")
```
# This report has been created on twitter data from `r date1` to `r date2`.
# Analysis of Tweets
## Below we can see the most frequent words.
```{r frequent,echo=FALSE,message=FALSE,warning=FALSE,cache=TRUE}
setwd("C:/ProjectSocial/Data/TwitterData/Maybelline")
library(devtools)
library(twitteR)
library(tm)
library(ggplot2)
library(graph)
library(Rgraphviz)
library(wordcloud)
library(topicmodels)
library(data.table)
library(fpc)
library(igraph)
library(xlsx)
library(stringr)
tweets.df<-data.frame(text=character(),favorited=character(),favoriteCount=numeric(),replyToSN=character(),
created=as.POSIXct(character()),truncated=character(),replyToSID=character(),id=character(),replyToUID=character(),statusSource=character(),screenName=character(),retweetCount=numeric(),
isRetweet=character(),retweeted=character(),longitude=character(),latitude=character(),stringsAsFactors =F)
i<-1
while(i<=7){
since<-Sys.Date()-i
file<-read.xlsx2(file=paste("Maybelline",since,".xlsx",sep=""), 1,colClasses = c(rep("character",2),
"numeric","character","POSIXct",rep("character",6),"numeric",rep("character",4)), stringsAsFactors=F)
tweets.df<-rbind(tweets.df,file)
i<-i+1
}
j<-1
HashTagsList<-c()
HashTags<-str_extract_all(tweets.df$text,"#\\S+")
HashTags<-HashTags[!HashTags %in% c("character(0)")]
while (j<=length(HashTags)){
HashTagsList<-c(HashTagsList,HashTags[[j]])
j<-j+1
}
HashTagsList<- gsub("#", "", HashTagsList)
HashTagsList<-unique(HashTagsList)
HashTagsList<-gsub("[^[:alnum:] ]", "", HashTagsList)
k<-1
HandleTagsList<-c()
HandleTags<-str_extract_all(tweets.df$text,"@\\S+")
HandleTags<-HandleTags[!HandleTags %in% c("character(0)")]
while (k<=length(HandleTags)){
HandleTagsList<-c(HandleTagsList,HandleTags[[k]])
k<-k+1
}
HandleTagsList<- gsub("@", "", HandleTagsList)
HandleTagsList<-unique(HandleTagsList)
HandleTagsList<-gsub("[^[:alnum:] ]", "", HandleTagsList)
tweets.df$text<-gsub("#\\S+", "", tweets.df$text)
tweets.df$text<-gsub("@\\S+", "", tweets.df$text)
Tweets.df<-subset(tweets.df,isRetweet=="FALSE")
Tweets.df$text<-gsub("[^[:alpha:] ]", " ", Tweets.df$text)
Tweets.df$text<-tolower(Tweets.df$text)
myCorpus <-Corpus(VectorSource(Tweets.df$text))
myStopwords<-c(stopwords("english"),"maybelline","https","like","bring","make","thought","please","maybe",
"know","just","want","wearing","really","last","better","best","first")
myCorpus<-tm_map(myCorpus,removeWords,myStopwords)
myCorpus<-tm_map(myCorpus,removeWords,HashTagsList)
myCorpus<-tm_map(myCorpus,removeWords,HandleTagsList)
myCorpus <- tm_map(myCorpus, PlainTextDocument)
myTdm<-TermDocumentMatrix(myCorpus,control=list(wordLengths=c(4,13)))
freq.Terms<- findFreqTerms(myTdm,lowfreq=20)
termFrequency <- rowSums(as.matrix(myTdm))
termFrequency <- subset(termFrequency, termFrequency>=20)
df <- data.frame(term=names(termFrequency), freq=termFrequency,stringsAsFactors = F)
df <- df[order(-df$freq),]
rownames(df) <- NULL
print(head(df,50), row.names = FALSE)
df<-head(df,40)
ggplot(df,aes(x=term,y=freq)) + geom_bar(stat="identity") + xlab("Terms") +ylab("Count") +coord_flip()
```
## Below we can find all the words which are associated with the top 10 most frequent words and having correlation > 0.5.
```{r assoc ,echo=F,message=FALSE}
library(tm)
findAssocs(myTdm,df$term[1:10],0.5)
```
最佳答案
出现错误是因为我使用了 echo=F 而不是 echo=FALSE。 F 或 T 被视为符号,因此会产生问题。
这就是为什么 F(或 T)是符号的原因(请参阅 ?is.symbol 以了解符号是什么):
> str(alist(warning = F))
List of 1 $ warning: symbol F > str(alist(warning = FALSE)) List of 1 $ warning: logi FALSE
关于r - 对象中的错误 [seq_len(ile)] : object of type 'symbol' is not subsettable,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42635748/
我有以下数据框: > head (data) verb_object SESS
我是编码和使用 r 的新手,有 2 个关于 seq_len(n) 的问题。我的第一个问题是,在我的一个讲义中,我们被告知使用 seq_len(n) 代替 1:n,因为它有助于解决 n=0 的情况。当使
从 R 过渡到 Python,我很难复制以下代码: df = df %>% group_by(ID) %>% slice(seq_len(min(which(F 详细信息 以下数据帧显示了原始数据帧
这个问题在这里已经有了答案: groupby counter of rows (2 个答案) 关闭 4 年前。 我正在尝试在我的 data.frame 中的组内进行索引 例如,在这个数据框中 Col
我正在尝试使用渲染语句将 rmd 文件转换为 pdf。 render("MiningReport.Rmd", "pdf_document",output_dir = "C:/ProjectSocial
我跑了 renv::status() 回来了: Error in seq_len(length(splat) - 1) : argument must be coercible to non-ne
这个问题不言自明。但是在 R 中有多个函数可以做同样的事情肯定是有原因的。 在循环内,是 seq_len() 之一或 :在速度方面更受欢迎? 在我看来,文档并不能说明全部情况。 最佳答案 首先要注意s
我是一名优秀的程序员,十分优秀!