gpt4 book ai didi

r - "incomplete final line"的更多问题

转载 作者:行者123 更新时间:2023-12-02 00:24:32 28 4
gpt4 key购买 nike

这个问题和看到的类似here .

我有大量大型 CSV,我正在通过函数连续加载和解析它们。其中许多 CSV 没有问题,但是当我尝试使用 read.csv() 加载它们时,有几个会导致问题。

我已将其中一个文件上传到公共(public) Dropbox 文件夹 here (请注意,该文件大约为 10.4MB)。

当我尝试读取.csv() 那个文件时,我收到了警告信息:

In read.table(file = file, header = header, sep = sep, quote = quote,  :
incomplete final line found by readTableHeader on ...

尽管我在 StackOverflow 和 Rhelp 上搜索解决方案,但我无法隔离问题。令人抓狂的是,当我运行时

Import <- read.csv("http://dl.dropbox.com/u/83576/Candidate%20Mentions.csv")

使用 Dropbox URL 而不是我的本地路径,它会加载,但是当我保存那个数据框并尝试重新加载它时:

write.csv(Import, "Test_File.csv", row.names = F)
TestImport <- read.csv("Test_File.csv")

我再次收到“不完整的最后一行”警告。

所以,我想知道为什么 Dropbox 加载的版本有效,而本地版本无效,以及如何让我的本地版本有效——因为我有大约 400 个这样的文件(而且每个文件都更多)天),我无法使用无法以某种方式实现自动化的解决方案。

在一个相关的问题中,似乎某些“特殊字符”中断了 read.csv() 进程,并阻止了整个文件的加载,这也许值得自己提出问题。例如,一个包含 14,760 行的 CSV 仅加载 3,264 行。第 3,264 行包含这条 Eloquent 推文:

"RT @akiron3: ácÎå23BkªÐÞ'q(@BarackObama )nĤÿükTPP ÍþnĤüÈ’áY‹ªÐÞĤÿüŽ \&’ŸõWˆFSnĤ©’FhÎåšBkêÕ„kĤüÈLáUŒ~YÒhttp://t.co/ABNnWfTN “jg)(WˆF"

同样,考虑到数百个文件的序列化加载,我如何 (a) 确定导致 read.csv() 进程中断的原因,以及 (b) 修复代码问题,而不是手工问题?

非常感谢您的帮助。

最佳答案

1)

 suppressWarnings(TestImport <- read.csv("Test_File.csv") )

2) 不匹配的报价是明显过早关闭的最常见原因。您可以尝试添加所有这些:

 quote="", na,strings="", comment.char=""

关于r - "incomplete final line"的更多问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9383128/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com