gpt4 book ai didi

r - "More Columns than Column Names"错误是什么意思?

转载 作者:行者123 更新时间:2023-12-03 03:36:42 27 4
gpt4 key购买 nike

我正在尝试从 IRS 读取 .csv 文件,但它的格式似乎没有任何奇怪的方式。

我正在使用 read.table() 函数,我过去曾多次使用过该函数,但这次不起作用;相反,我收到此错误:

data_0910<-read.table("/Users/blahblahblah/countyinflow0910.csv",header=T,stringsAsFactors=FALSE,colClasses="character")

Error in read.table("/Users/blahblahblah/countyinflow0910.csv", :
more columns than column names

为什么要这样做?

作为引用,.csv 文件可以在以下位置找到:

http://www.irs.gov/uac/SOI-Tax-Stats-County-to-County-Migration-Data-Files

(我需要的位于县到县迁移 .csv 部分 - 流入或流出。)

最佳答案

它使用逗号作为分隔符。因此,您可以设置 sep="," 或仅使用 read.csv:

x <- read.csv(file="http://www.irs.gov/file_source/pub/irs-soi/countyinflow1011.csv")
dim(x)
## [1] 113593 9

该错误是由某些值中的空格和不匹配的引号引起的。标题中没有空格,因此 read.table 认为只有一列。然后它认为它在某些行中看到了多个列。例如,前两行(标题和第一行):

State_Code_Dest,County_Code_Dest,State_Code_Origin,County_Code_Origin,State_Abbrv,County_Name,Return_Num,Exmpt_Num,Aggr_AGI
00,000,96,000,US,Total Mig - US & For,6973489,12948316,303495582

以及不匹配的引号,例如第 1336 行(第 1335 行),这会将 read.table 与默认的 quote 参数混淆(但不会将 read.csv ):

01,089,24,033,MD,Prince George's County,13,30,1040

关于r - "More Columns than Column Names"错误是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24028093/

27 4 0