read.table 自动列名-6ren

read.table 自动列名

转载作者：行者123 更新时间：2023-12-02 21:19:17

25

4

我注意到，当通过

读取大型 csv 文件时

output <- read.table( ..., header = TRUE, sep = ",")

创建的数据框有一些空白列。这些列遵循命名模式

 colnames(output)
     "Factor.1"   "Factor.2"   "etc"        "Stuff"      "X"          "X.1"        "X.2"        "X.3"        "X.4"        "X.5"       
     "X.6"        "X.7"        "X.8"        "X.9"        "X.10"       "X.11"       "X.12"       "X.13"      
     "X.14"       "X.15"       "X.16"       "X.17"       "X.18"       "X.19"       "X.20"       "X.21"      
     "X.22"       "X.23"       "X.24"       "X.25"       "X.26"       "X.27"       "X.28"       "X.29"      
     "X.30"       "X.31"       "X.32"       "X.33"

我注意到在 ?read.table 中它指出

col.names: a vector of optional names for the variables. The default is to use "V" followed by the column number.

为什么它对我使用 X 而不是 V？

编辑:这就是 csv 文件的样子

Date,Duration,Count,Factor 1,Factor 2,Factor 3,Hour,Day,Month,Year,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 0:00,9.99,10,GC,LS,FT,0,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 1:00,9.63125,8,GC,LS,FT,1,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 2:00,7.388888889,3,GC,LS,FT,2,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 3:00,7.087037037,9,GC,LS,FT,3,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

...

最佳答案

这是来自 read.table() 的相关代码片段

if (header) {
    .External(C_readtablehead, file, 1L, comment.char, 
              blank.lines.skip, quote, sep, skipNul)
    if (missing(col.names)) 
        col.names <- first
    else if (length(first) != length(col.names)) 
        warning("header and 'col.names' are of different lengths")
}

这是 if (missing(col.names)) col.names <- first这很重要。从那里，我们可以返回并获取 first ，针对这种情况定义为

first <- scan(textConnection(file), what = "", sep = ",", 
    nlines = 1, quiet = TRUE, skip = 0, strip.white = TRUE)

结果

#  [1] "Date"     "Duration" "Count"    "Factor 1" "Factor 2" "Factor 3" "Hour"     "Day"      "Month"   
# [10] "Year"     ""         ""         ""         ""         ""         ""         ""         ""        
# [19] ""         ""         ""         ""         ""         ""         ""         ""         ""        
# [28] ""         ""         ""         ""         ""         ""         ""         ""         ""        
# [37] ""         ""         ""         ""         ""         ""         ""         ""

然后，make.names()被调用col.names ，得到你的名字

make.names(first, unique = TRUE)
#  [1] "Date"     "Duration" "Count"    "Factor.1" "Factor.2" "Factor.3" "Hour"     "Day"      "Month"   
# [10] "Year"     "X"        "X.1"      "X.2"      "X.3"      "X.4"      "X.5"      "X.6"      "X.7"     
# [19] "X.8"      "X.9"      "X.10"     "X.11"     "X.12"     "X.13"     "X.14"     "X.15"     "X.16"    
# [28] "X.17"     "X.18"     "X.19"     "X.20"     "X.21"     "X.22"     "X.23"     "X.24"     "X.25"    
# [37] "X.26"     "X.27"     "X.28"     "X.29"     "X.30"     "X.31"     "X.32"     "X.33"

我们得到X的原因而不是V如文档中所述，是因为 if(header) 之后的下一个条件是

else if (missing(col.names)) 
    col.names <- paste0("V", 1L:cols)

但我们从未做到这一点，并且 make.names()连接到 X默认情况下。除了这个解释之外，还有更多内容。最好的办法是浏览 read.table来源(很复杂)。

数据:

file <- "Date,Duration,Count,Factor 1,Factor 2,Factor 3,Hour,Day,Month,Year,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 0:00,9.99,10,GC,LS,FT,0,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 1:00,9.63125,8,GC,LS,FT,1,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 2:00,7.388888889,3,GC,LS,FT,2,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1/1/2012 3:00,7.087037037,9,GC,LS,FT,3,7,1,2012,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,"

关于read.table 自动列名，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28619973/

25

4

0

文章推荐： tcl lsort 对字符串中的最后 n 个字符

文章推荐： Ida Pro 图形输出批处理模式

文章推荐： javascript - 从 Firestore 获取记录进行分页 - Ionic/Angular

文章推荐： javascript - Svelte img 错误处理程序没有被调用

rust - 为什么 Read::read 和 Read::read_exact 需要初始化传递给它们的缓冲区？
我有一个阅读器，其中包含有关 51*51 网格的信息，其中网格上的每个点都由 f32 表示。 .我想将这些数据读入一个向量，以便我可以轻松处理它: pub fn from_reader(reader:
sql-server - 为什么在 SQL Server 中首次执行查询时 'physical reads' 小于 'read-ahead reads' 和 'logical reads'？
我重新启动了 SQL Server 2005 并运行了统计 IO 的查询。我得到了这些结果:表“xxx”。扫描计数 1，逻辑读取 789，物理读取 3，预读读取 794，... 预读读取数是读取并放
lisp - defstruct - :read-only is not read only
在 CLHS 中，我为 :read-only x 读到:“当 x 为真时，这指定不能更改此插槽；它将始终包含构造时提供的值。” 我可以做到这一点(CCL、SBCL): CL-USER> (defstr
multithreading - “reads before reads”在内存排序中是什么意思？
让我们考虑一下这句话(Total Store Ordering): reads are ordered before reads, writes before writes, and reads be
rust - Read::read 是否保证附加数据而不覆盖任何现有数据？
我正在开发一个 SMTP 库，它使用缓冲读取器通过网络读取行。我想要一种安全的方式来从网络读取数据，而不依赖于 Rust 内部机制来确保代码按预期工作。具体来说，我想知道 Read trait 是否
Clojure & ClojureScript : clojure. core/read-string, clojure.edn/read-string 和 cljs.reader/read-string
我不清楚所有这些读取字符串函数之间的关系。嗯，很明显clojure.core/read-string可以读取 pr[n] 输出的任何序列化字符串甚至 print-dup .也很清楚clojure.ed
c - 如何使 read() 非阻塞并重置 read()
所以我做了这个功能，就像倒计时一样。我想在倒计时减少时读取命令。我的大问题是让 read() 在倒计时减少时等待输入。如您所见，我尝试使用 select() 但在第一个 printf 之后("time
echart报错Cannot read properties of undefined (reading ‘type‘)
这是我vue3+echart5 遇到的报错：Cannot read properties of undefined (reading ‘type‘) 这个问题需要搞清楚两个关键方法： toRaw：作
c - LLVM 内存依赖性分析中的 Read after Read 依赖性
下图中，左边是C代码，右边是未优化的LLVM IR形式。 The Figure 在 IR 上运行 MemoryDependenceAnalysis 可查找内存依赖性。原始代码及其 IR 等效代码中
bash - 为什么管道输入到 "read"仅在馈入 "while read ..."构造时才有效？
这个问题在这里已经有了答案: Read values into a shell variable from a pipe (17 个答案) 关闭 3 年前。我一直在尝试像这样从程序输出中读取环境变
c - 需要像 read() 这样的函数将整数数据读入缓冲区并获得与 read() 相同的缓冲区值
当我输入相同的整数时，如何将整数转换为与使用 read(0,buff,nbytes) 获得的缓冲区相同的值/编码字符？我正在尝试编写类似 read() 的东西，但用整数数据代替读取到缓冲区的文件描述符
linux - “read”命令不在“while read line”循环中执行
This question already has answers here: Closed 2 years ago. Read input in bash inside a while loop （
c# - 在调用 Read() 之前尝试访问字段无效，但我先调用了 Read()
我正在尝试处理来自 MySQL 数据库的一些数据(主要是 double 值)。我收到此错误消息: Invalid attempt to access a field before calling Re
java - DataInputStream.read() 与 DataInputStream.readFully()
我正在制作一个简单的 TCP/IP 套接字应用这样做有什么不同: DataInputStream in = new DataInputStream(clientSocket.getInputStre
java - HttpMessageNotReadableException : Could not read JSON: Read timed out
我操作API服务器。手机APP访问API服务器时，有时会出现该异常。我尝试在测试服务器上进行测试，但无法重现。(我改变了apache和tomcat的连接时间。) 有什么问题？？我该如何解决这个问
html - "Click here to read this article""Read More"为什么这些对屏幕阅读器不利？
我在段落末尾使用“阅读更多”只是为了提醒像P.T.O一样的用户为什么会有问题？最佳答案您必须明白，许多屏幕阅读器用户不会等到整个页面都读给他们听。他们使用键盘快捷键在页面中导航。 JAWS(可以
angular - 类型错误 : Cannot read properties of undefined (reading 'match' )
我已将我的 Angular 应用程序从 12 版本升级到 13 版本。我在单元测试运行期间开始遇到此错误。 Chrome Headless 94.0.4606.61 (Windows 10) AppC
angular - 类型错误 : Cannot read properties of undefined (reading 'pipe' )
我正在尝试为以下组件编写一个。我正在使用 queryParams 然后使用 switchmap 来调用服务。这是 url 的样子: http://localhost:4200/test-fee/det
javascript - 未捕获的类型错误 : Cannot read properties of undefined (reading 'remove' )
我的代码有什么问题？ Uncaught TypeError: Cannot read properties of undefined (reading 'remove') 和 Uncaught Typ
javascript - 类型错误 : Cannot read properties of undefined (reading 'requestContent' )
我在我的 React 应用程序中遇到了这个问题。类型错误:无法读取未定义的属性(读取“requestContent”) 我在我的应用程序中使用 commercejs。代码指向 isEmpty=!ca

首页

博学

6Ren·AI

商城

read.table 自动列名