gpt4 book ai didi

r - 使用 R 中 'na.strings' 函数的 'colClasses' 和 'fread' 参数读取数据时,列模式错误

转载 作者:行者123 更新时间:2023-12-01 22:32:30 25 4
gpt4 key购买 nike

Windows 8.1、R 版本 3.1.1 (2014-07-10)、系统 x86_64、mingw32

我有一个包含大量观察结果的文件 ( here )。以下是文件中的一些字符串

Date;Time;Global_active_power;Global_reactive_power;Voltage;Global_intensity;Sub_metering_1;Sub_metering_2;Sub_metering_3
16/12/2006;17:24:00;4.216;0.418;234.840;18.400;0.000;1.000;17.000
16/12/2006;17:25:00;5.360;0.436;233.630;23.000;0.000;1.000;16.000
28/4/2007;00:20:00;0.492;0.208;236.240;2.200;0.000;0.000;0.000
28/4/2007;00:21:00;?;?;?;?;?;?;
21/12/2006;11:25:00;0.246;0.000;241.740;1.000;0.000;0.000;0.000
21/12/2006;11:26:00;0.246;0.000;241.830;1.000;0.000;0.000;0.000

NA值用“?”表示。我正在尝试使用

读取文件
epcData <- fread(dataFile,
sep = ";",
header = TRUE,
na.strings = "?",
colClasses = c("character", "character", rep("numeric", 7)),
stringsAsFactors = FALSE)

我收到如下警告:

Bumped column 3 to type character on data row 10, field contains '?'. Coercing previously read values in this column from integer or numeric back to character which may not be lossless; e.g., if '00' and '000' occurred before they will now be just '0', and there may be inconsistencies with treatment of ',,' and ',NA,' too (if they occurred in this column before the bump). If this matters please rerun and set 'colClasses' to 'character' for this column. Please note that column type detection uses the first 5 rows, the middle 5 rows and the last 5 rows, so hopefully this message should be very rare. If reporting to datatable-help, please rerun and include the output from verbose=TRUE.

第 10 行是

   28/4/2007;00:21:00;?;?;?;?;?;?;

epcData[10]

打印

         Date     Time Global_active_power Global_reactive_power Voltage
1: 28/4/2076 00:21:00 NA NA NA
Global_intensity Sub_metering_1 Sub_metering_2 Sub_metering_3
1: NA NA NA NA

但是所有列的模式都是“字符”,即使对于第 3:9 列也是如此(但是 colClasses = c("character", "character", rep("数字”,7)))。

出了什么问题?

最佳答案

从今天开始,data.table 包的版本为 1.12.2。这不再是问题,上述 csv 数据的导入工作完美,所有问号都替换为 NAs

关于r - 使用 R 中 'na.strings' 函数的 'colClasses' 和 'fread' 参数读取数据时,列模式错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25724918/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com