gpt4 book ai didi

readr::read_csv问题:汉字变成乱码

转载 作者:行者123 更新时间:2023-12-03 07:21:16 33 4
gpt4 key购买 nike

我正在尝试将数据集导入到 RStudio,但是我遇到了汉字问题,因为它们变成了困惑的代码。这是代码:

library(tidyverse)
df <- read_csv("中文,英文\n英文,德文")
df
# A tibble: 1 x 2
`\xd6\xd0\xce\xc4` `Ӣ\xce\xc4`
<chr> <chr>
1 "<U+04E2>\xce\xc4" "<U+00B5>\xc2\xce\xc4"

当我使用基本函数 read.csv 时,它运行良好。我想我一定是在编码方面做错了什么。但是read_csv中没有编码选项,我该怎么办?

最佳答案

这是因为字符被标记为UTF-8,而实际编码是系统默认的(可以通过stringi::stri_enc_get()获取)。

因此,您可以执行以下任一操作:

1)使用正确的编码读取数据:

df <- read_csv("中文,英文\n英文,德文", locale = locale(encoding = stringi::stri_enc_get()))

2)读取编码不正确的数据,并稍后使用正确的编码对其进行标记(请注意,这并不总是有效):

df <- read_csv("中文,英文\n英文,德文")
df <- dplyr::mutate_all(df, `Encoding<-`, value = "unknown")

关于readr::read_csv问题:汉字变成乱码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46996501/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com