gpt4 book ai didi

r - check_input(x) 错误 : Input must be a character vector of any length or a list of character vectors, 每个长度为1

转载 作者:行者123 更新时间:2023-12-02 14:48:35 24 4
gpt4 key购买 nike

使用 tidytext 包,我想将我的 tibble 转换为每行每文档一个标记。我将 tibble 的文本列从因子转换为字符,但我仍然遇到相同的错误。

text_df <- tibble(line = 1:3069, text = text)

我的 tibble 看起来像这样,以一列作为字符:

# A tibble: 3,069 x 2
line text$text
<int> <chr>

然而,当我尝试应用 unnest_tokens 时:

text_df %>%
unnest_tokens(word, text$text)

我总是得到同样的错误:

Error in check_input(x) :Input must be a character vector of any length or a list of charactervectors, each of which has a length of 1.

我的代码有什么问题?

PS:我看过关于这个主题的不同帖子,但没有运气。

谢谢

最佳答案

至少部分问题是包含“$”的变量名。您在代码中有效地做的是尝试从对象“文本”中获取元素“文本”,这可能是函数 graphics::text 而不是子集。

更改“text$text”的名称或用反引号括起来:

text_df %>% 
unnest_tokens(word, `text$text`)

一般来说,你应该避免在变量名中使用特殊字符,因为它只会导致像这样的错误。

如果您的问题仍然存在,请提供一个最小的可重现示例: How to make a great R reproducible example

关于r - check_input(x) 错误 : Input must be a character vector of any length or a list of character vectors, 每个长度为1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57465241/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com