gpt4 book ai didi

r - 具有多个时间序列的 csv 文件

转载 作者:行者123 更新时间:2023-12-02 00:46:06 27 4
gpt4 key购买 nike

我已经导入了一个包含大量数据列和部分的 csv 文件。

v <- read.csv2("200109.csv", header=TRUE, sep=",", skip="6", na.strings=c(""))

文件的布局是这样的:
Dataset1
time, data, .....
0 0
0 <NA>
0 0

Dataset2
time, data, .....
00:00 0
0 <NA>
0 0

(不同数据集的标题完全相同。

现在,我可以绘制第一个数据集:
plot(as.numeric(as.character(v$Calls.served.by.agent[1:30])), type="l")

我很好奇是否有更好的方法:
  • 获取所有读取为数字的数字,而无需转换。
  • 以某种有意义的方式处理文件中的不同数据集。

  • 任何提示将不胜感激。谢谢你。

    状态更新:

    我还没有真正在 R 中找到一个好的解决方案,但我已经开始在 Lua 中编写一个脚本来将每个单独的时间序列分成一个单独的文件。我暂时将其保持开放状态,因为我很好奇 R 将如何处理所有这些文件。我每天会收到 8 个文件。

    最佳答案

    我个人会做的是在文件被读入 R 之前用某种脚本语言制作一个脚本来分离不同的数据集,并可能做一些必要的数据转换。

    如果要在 R 中进行拆分,请查找 readLinesscanread.csv2太高级了,用于读取单个数据帧。您可以将不同的数据集写入不同的文件中,或者如果您雄心勃勃,可以编写可用于 read.csv2 的类似文件的 R 对象。并从底层大文件的正确部分读取。

    一旦您将数据集分离到不同的文件中,请使用 read.csv2在那些(或最好的 read.table 变体 - 如果那些不是选项卡而是固定宽度的字段,请参阅 read.fwf )。如 <NA>在您的文件中表示“不可用”,请务必将其指定为 na.strings 的一部分.如果你不这样做,R 认为你在该领域有非数字数据,但正确的 na.strings ,您会自动将该字段转换为数字。似乎您的字段之一可以包含时间戳,如 00:00 ,所以你需要使用 colClasses并指定一个类,您的时间戳格式可以转换为该类。如果内置Date类不起作用,只需定义自己的 timestamp类和 as.timestamp进行转换的函数。

    关于r - 具有多个时间序列的 csv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/509595/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com