gpt4 book ai didi

r - 将编码应用于整个数据表

转载 作者:行者123 更新时间:2023-12-04 12:36:13 25 4
gpt4 key购买 nike

我将以下文件读入data.table中,如下所示:

raw <- fread("avito_train.tsv", nrows=1000)

然后,如果我像这样更改特定列和行的编码:
Encoding(raw$title[2]) <- "UTF-8"

它完美地工作。

但是,如何将编码应用于所有列和所有行?

我检查了 fread文档,但似乎没有任何编码选项。另外,我尝试了 Encoding(raw),但是这给了我一个错误(预期为字符向量参数)。

编辑:本文详细介绍了Windows RStudio上有关外来文本的更多信息 http://quantifyingmemory.blogspot.com/2013/01/r-and-foreign-characters.html

最佳答案

最近已在data.table的开发版本v1.9.5中实现了此功能。它将很快被推送到CRAN(从v1.9.6开始)。您能尝试一下开发版本,看看是否能为您解决这个问题吗?
fread()获得了encoding参数,专门用于Windows问题。

require(data.table) # v1.9.5+
fread("file.txt", encoding="UTF-8")

应该解决问题。没有文件可供我测试。如果仍不能解决您的问题,请在项目页面上提交问题,并附上可复制的示例/文件。

关于r - 将编码应用于整个数据表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24492969/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com