gpt4 book ai didi

r - 为什么 R 将 UTF-8 header 读取为文本?

转载 作者:行者123 更新时间:2023-12-01 23:21:35 24 4
gpt4 key购买 nike

我将 Excel 表格另存为文本 (*.txt)。不幸的是,Excel 不允许我选择编码。所以我需要在记事本中打开它(以ANSI打开)并将其另存为UTF-8。然后,当我在 R 中阅读它时:

data <- read.csv("my_file.txt",header=TRUE,sep="\t",encoding="UTF-8")

它显示以“X.U.FEFF.”开头的第一列的名称。我知道这些字节是保留的,用于告诉任何程序该文件是 UTF-8 格式。所以它不应该显示为文本!这是一个错误吗?或者我错过了一些选择?提前致谢!

最佳答案

所以我本来打算向您提供有关如何手动打开文件并检查和丢弃 BOM 的说明,但后来我注意到了这一点(在 ?file 中):

As from R 3.0.0 the encoding "UTF-8-BOM" is accepted and will remove a Byte Order Mark if present (which it often is for files and webpages generated by Microsoft applications).

这意味着如果您有一个足够新的 R 解释器,

read.csv("my_file.txt", fileEncoding="UTF-8-BOM", ...other args...)

应该做你想做的事。

关于r - 为什么 R 将 UTF-8 header 读取为文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19936699/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com