readr::read_csv问题:汉字变成乱码-6ren

readr::read_csv问题:汉字变成乱码

转载作者：行者123 更新时间：2023-12-03 07:21:16

33

4

我正在尝试将数据集导入到 RStudio，但是我遇到了汉字问题，因为它们变成了困惑的代码。这是代码:

library(tidyverse)
df <- read_csv("中文,英文\n英文,德文")
df
# A tibble: 1 x 2
  `\xd6\xd0\xce\xc4`            `Ӣ\xce\xc4`
               <chr>                  <chr>
1 "<U+04E2>\xce\xc4" "<U+00B5>\xc2\xce\xc4"

当我使用基本函数 read.csv 时，它运行良好。我想我一定是在编码方面做错了什么。但是read_csv中没有编码选项，我该怎么办？

最佳答案

这是因为字符被标记为UTF-8，而实际编码是系统默认的(可以通过stringi::stri_enc_get()获取)。

因此，您可以执行以下任一操作:

1)使用正确的编码读取数据:

df <- read_csv("中文,英文\n英文,德文", locale = locale(encoding = stringi::stri_enc_get()))

2)读取编码不正确的数据，并稍后使用正确的编码对其进行标记(请注意，这并不总是有效):

df <- read_csv("中文,英文\n英文,德文")
df <- dplyr::mutate_all(df, `Encoding<-`, value = "unknown")

关于readr::read_csv问题:汉字变成乱码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46996501/

33

4

0

readr::type_convert 弄乱了时间列
我有以下 R 数据框: zed # A tibble: 10 x 3 jersey_number first_name statistics.minutes
readr::read_csv问题:汉字变成乱码
我正在尝试将数据集导入到 RStudio，但是我遇到了汉字问题，因为它们变成了困惑的代码。这是代码: library(tidyverse) df 1 "\xce\
r - 如何安装库(readr)？
我很惊讶 library(readr) 无法突然加载: library(readr) Error in loadNamespace(j <- imp[[1L]], c(lib.loc, .libPat
使用正则表达式通过 readr 读取列
我需要导入具有不同列号的数据文件。最后，该代码应该由其他对 R 不太熟悉的同事使用。因此它应该是健壮的，并且最好没有警告消息。主要问题是 header 总是以附加的“,”结尾，这不会出现在下面的数据中
使用 `readr::read_csv_chunked()`批量读取csv文件
我想读取较大的csv文件，但遇到内存问题。因此，我想尝试使用read_csv_chunked()包中的readr读取它们。我的问题是我不太了解callback参数。这是到目前为止我尝试过的一个最小的
readr - 加载一个压缩的 csv 文件
从这个代码: require(readr) readK6 <- read_csv("./data/K6.csv.zip", col_types = c("char
从 readr::read_csv 中读取的数据中删除属性
readr::read_csv添加在编辑数据时不会更新的属性。例如， library('tidyverse') df % sapply(n_distinct) no_info % select(-
r - readr()/read_csv中，如何导入所有列为字符的数据
在readr()/read_csv中，如何导入所有列为字符的数据？谢谢! library(tidyverse) read_csv(readr_example("mtcars.csv"))) 最佳
r:readr:write_csv 如何压缩文件？
20MB 以上的 CSV 文件对电子邮件不礼貌。用户如何用最少的代码压缩文件？非压缩任务是: mtcars %>% write_csv('foocars.csv') rea
r - readr()/read_csv中，如何导入所有列为字符的数据
在readr()/read_csv中，如何导入所有列为字符的数据？谢谢! library(tidyverse) read_csv(readr_example("mtcars.csv"))) 最佳
r:readr:write_csv 如何压缩文件？
20MB 以上的 CSV 文件对电子邮件不礼貌。用户如何用最少的代码压缩文件？非压缩任务是: mtcars %>% write_csv('foocars.csv') rea
readr::read_csv() 不读取日期并返回 NA
我有一个 csv 文件 test.csv，其中有一列包含日期: V1 14-01-02 9:10 14-01-02 9:10 14-01-02 9:21 14-01-02 9:34 14-01-02
readr - 在 CSV 中导入日期列
我需要关于如何使用 readr 导入数据的建议通过输入我自己的日期格式我正在尝试的方式是: read_csv("test", col_types = cols( column-name = col_
r - readr 中允许的 "col_*()"形式的列对象是什么？
readr::read_csv 误读了我正在加载的文件中的某些列类型，因此我想使用 cols 手动设置它们。在 ?read_csv 中，它表示 col_types 参数应该是 _"'NULL' 之一
r - 如何强制 readr 考虑正确的小数/分组标记？
具有欧洲数字格式样式 (1234.56 -> 1.234,56) 的 csv 文件应该由 readr 函数或 fread() 处理。尽管 read_csv2() 应该正是为这个任务设计的，但它基本上忽
r - 如何将参数传递给 readr::read_csv_chunked 的回调函数
我一直在玩读者的read_delim_chunked职能。基于 documentation ，目前尚不清楚如何或是否可能将参数传递给回调函数。例如，来自文档示例: # Cars with 3 gear
r - 忽略 readr::read_csv 中的尾随分隔符
当我使用 readr::read_csv 读取包含尾随分隔符的 CSV 文件时，我收到一条警告，提示填写了缺失的列名。以下是重现此警告的简短示例 CSV 文件的内容(将以下代码段存储在名为 examp
r - 使用 readr::parse_double() 解析双分组数
代码显示为: readr::parse_double("123,456,789.987", locale = locale(decimal_mark = "."
rstudio - 在 readr 和 knitr 中显示进度
我目前正在使用 .Rmd 笔记本，RStudio 版本 1.1.442。根据 Knitr 手册和各种小插图中的不同示例，在我的笔记本中，我要求 readr(已安装版本:1.1.1)不显示进度使用隐藏
r - readr read_csv 是否允许在 zip 中指定特定文件
tidyverse 中的 readr 包可以选择自动解压缩 zip 文件并将其转换为 tibble。但是我有一个包含多个 csv 文件的 zip 文件。在下面的代码行中，SSPdataZip 中有三个

首页

博学

6Ren·AI

商城

readr::read_csv问题:汉字变成乱码