gpt4 book ai didi

xml - 我将如何解析 R 中的 XML 文件并对数据进行基本统计分析

转载 作者:数据小太阳 更新时间:2023-10-29 02:00:39 25 4
gpt4 key购买 nike

我正在尝试用 R 解析 XML 文件,以便分析数据。我正在尝试获取价格的均值和标准差。此外,我希望能够获得股价变化时的变化率。我曾尝试手动输入数据,但在日期结构方面遇到问题(我已尝试以下操作:

z <- strptime ("HH:MM:SS.ms, "%H:%m:%S.%f")

但它失败了)。我知道 XML 文件只有很少的数字,但它是一个可以自动化的过程吗?如果是的话,我需要什么包? (我是 R 的新手)。任何帮助将不胜感激。

谢谢,安东尼。

<?xml version = "1.0"?>
<Company >
<shareprice>
<timeStamp> 12:00:00:01</timeStamp>
<Price> 25.02</Price>
</shareprice>



<shareprice>
<timeStamp> 12:00:00:02</timeStamp>
<Price> 15</Price>
</shareprice>



<shareprice>
<timeStamp> 12:00:00:025</timeStamp>
<Price> 15.02</Price>
</shareprice>



<shareprice>
<timeStamp> 12:00:00:031</timeStamp>
<Price> 18.25</Price>
</shareprice>



<shareprice>
<timeStamp> 12:00:00:039</timeStamp>
<Price> 18.54</Price>
</shareprice>



<shareprice>
<timeStamp> 12:00:00:050</timeStamp>
<Price> 16.52</Price>
</shareprice>


<shareprice>
<timeStamp> 12:00:01:01</timeStamp>
<Price> 17.50</Price>
</shareprice>
</Company>

最佳答案

z <- strptime ("HH:MM:SS.ms, "%H:%m:%S.%f")

你错过了结束 " 所以它是无效的语法。

接下来,数据是非标准的,因为我们会使用点表示秒。亚秒,即 12:23:34.567 来表示时间戳。毫秒可以这样解析

> ts <- "12:00:00.050"
> strptime(ts, "%H:%M:%OS")
[1] "2010-07-09 12:00:00 CDT"
>

所以你不仅需要先把它从XML中取出来,还需要对字符串进行转换。否则,您可以“手动”解析字符串并填充 POSIXlt 时间结构。

后记:忘记提及您需要启用亚秒级打印:

> options("digits.secs"=3)         # shows milliseconds (three digits)
> strptime(ts, "%H:%M:%OS")
[1] "2010-07-09 12:00:00.05 CDT" # suppresses trailing zero
>

后记 2:由于 XML,您的文件也很幸运包裹:

> library(XML)
> xmlToDataFrame("c:/Temp/foo.xml") # save your data as c:/Temp/foo.xml
timeStamp Price
1 12:00:00:01 25.02
2 12:00:00:02 15
3 12:00:00:025 15.02
4 12:00:00:031 18.25
5 12:00:00:039 18.54
6 12:00:00:050 16.52
7 12:00:01:01 17.50
>

关于xml - 我将如何解析 R 中的 XML 文件并对数据进行基本统计分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3215783/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com