gpt4 book ai didi

read.fwf和数字符号

转载 作者:行者123 更新时间:2023-12-04 00:54:13 25 4
gpt4 key购买 nike

我正在尝试使用this file中描述的固定宽度结构来读取the following link(3.8mb)。

该命令:

a <- read.fwf('~/ccsl.txt',c(2,30,6,2,30,8,10,11,6,8))

产生一个错误:

line 37 did not have 10 elements



用不同的skip选项值复制问题后,我发现引起问题的行都包含“#”符号。

有什么办法可以解决吗?

最佳答案

正如@jverzani所评论的那样,此问题可能是#符号通常用作表示评论的字符的事实。将comment.charread.fwf输入参数设置为非#可以解决此问题。我会将我的答案留在下面,作为更一般的情况,您可以在任何会引起问题的字符上使用(例如,荷兰城市名's中的's Gravenhage)。

我遇到了其他符号出现此问题的情况。我采用的方法是简单地将#替换为空或不生成错误的字符。在我的情况下,简单地替换字符是没有问题的,但是在您的情况下这可能是不可能的。

因此,我的方法是删除产生错误的符号,或替换为另一个字符。这可以使用R编辑器中的文本编辑器(查找和替换)或使用某些名为grepsed的linux工具来完成。如果要在R脚本中执行此操作,请使用scanreadLines读取行。一旦文本存储在内存中,就可以使用sub替换字符。

如果您不能替换该字符,我将尝试以下方法:用一个不会产生错误的字符替换该字符,使用read.fwf将其读入R,最后用#字符替换该字符。

关于read.fwf和数字符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8634506/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com