- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在考虑将 Azure 表存储 (ATS) 与 Deedle(或具有类似功能的其他库)一起使用来进行时间序列存储、操作和计算。据我所知,F# 似乎也是数组操作的不错选择。
我们的出发点是一组能源消耗的时间序列。该系列要么是一个间隔内的消耗(固定或不规则间隔),要么是一个计数器(从中我们可以计算从一个读数到下一个读数的消耗)。由于数据点只是一个标签(用作分区键)、时间戳(行键)和值,因此这应该非常适合 ATS。
从用户的角度来看,他们希望对给定周期和分辨率的序列进行计算,例如对于给定年份,以月度分辨率计算第三个系列作为其他两个系列之间的差异。
这引发了一些问题:
任何评论都将受到高度赞赏!
最佳答案
我认为Isaac已经提到了最重要的几点,但由于这个问题涉及到我所涉及的一些事情,我想我还需要补充一些意见!
BigDeedle。正如 Isaac 提到的,我在 BigDeedle 中使用了 Azure 表存储。 。如果您想使用 Deedle API 以交互方式探索数据并在将数据获取到内存中并运行计算之前进行一些过滤和范围限制,这非常有用。 BigDeedle 从可能非常大的外部数据源延迟加载数据。也就是说,如果您最终需要将所有数据加载到内存中,这对您来说可能没什么用。
BigDeedle 中使用的存储模型可能很有用 - 它根据日期对数据进行分区,因此当您想要获取给定日期范围内的值时,它知道要查找哪些分区。根据我的经验,从 ATS 加载数据效果非常好,特别是如果您可以在 Azure 中运行的 MBrace 集群上执行此操作(这就是我的 NDC 演示最终所做的)。
效率。我认为该组合应该适用于 10k 或 100k 数据点 - 无论您是从 F# 还是 C# 执行此操作都没有区别。至于 Deedle,我肯定已经将它用于这种大小的数据集 - 我们“根据需要”优化该库。大多数功能已经相当高效,但可能有一些操作效率不高。如果您在 GitHub 上提出问题,则可以修复此问题。
重采样。有用于线性插值的内置函数(请参阅 here ),但我怀疑您可能需要编写自己的自定义插值。 Deedle 不会向您“隐藏底层数据”,因此这并不太难 - this page 上的最后一个示例显示使用线性插值填充缺失数据的自定义函数。如果您要做这样的事情,则需要将数据存储在内存中(因此 BigDeedle 在这里不是很有用)。
指定计算。我怀疑这是一个单独的问题,但 F# 非常适合特定于领域的语言。我做了一个talk on that at earlier NDC 。一般来说,您可以指定自己的 DSL(并解析它),也可以使用嵌入式 DSL,人们可以在其中编写 F# 的子集。 F# 对两者都有很好的支持。
PS:如果您想获得有关 F#、Deedle 和 Azure 表的更多帮助,请随时与我们联系。我很高兴分享我的经验 - 您应该能够通过我的个人资料找到联系人。
关于azure - 时间序列的注意事项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43467879/
我正在阅读 Python 文档以真正深入了解 Python 语言,并遇到了 filter 和 map 函数。我以前使用过过滤器,但从未使用过映射,尽管我在 SO 上的各种 Python 问题中都见过这
当我尝试打印 BST 的级别顺序时,这个问题提示了我。 这是一个 Pre-Order Sequence: 4, 1, 2, 3, 5, 6, 7, 8 In_order Sequence : 1, 2
我的代码在 main(序列测试;)的第一行出现错误,指出它是对 sequence::sequence() 的 undefined reference 。我无法更改 main 中的代码。有谁知道我该如何
这可能很简单,但我在通常的 latex 指南中找不到任何相关内容。在这句话中: {\em hello\/} “\/”的目的是什么? 最佳答案 这就是所谓的斜体校正。其目的是确保斜体文本后有适当的间距。
当我从 Postgresql 表中删除所有记录,然后尝试重置序列以在插入时开始一个编号为 1 的新记录时,我得到不同的结果: SELECT setval('tblname_id_seq', (SELE
在版本10.0.3中,MariaDB引入了一种称为序列的存储引擎。 其ad hoc为操作生成整数序列,然后终止。 该序列包含正整数,以降序或升序排列,并使用起始,结束和递增值。 它不允许在多个查询中
如何在 Groovy 中获取给定数字的序列,例如: def number = 169 // need a method in groovy to find the consecutive number
基本上,如果这是 .NET,它看起来像这样: ISomething { string A { get; } int B { get; } } var somethings = new List
说以下代码部分(同一块): A <= 1 A <= 2 变量 A 总是被赋值为 2 吗?还是会出现竞争条件并分配 1 或 2? 我对非阻塞赋值的理解是,由硬件在 future 分配变量 A,因此它可能
在运行 WiX 设置时,我正在寻找操作列表及其顺序。不知何故,官方网站似乎没有提供任何信息。 基本问题是我想正确安排我的自定义操作。通常我需要使用 regsvr32.exe 注册一个 DLL,而这只能
F#初学者在这里 我想创建一个类型,它是具有至少一个元素的另一种具体类型(事件)的序列。任何其他元素都可以在以后随时添加。通常在 C# 中,我会创建一个具有私有(private) List 和公共(p
作为构建过程和不断发展的数据库的一部分,我试图创建一个脚本,该脚本将删除用户的所有表和序列。我不想重新创建用户,因为这将需要比所允许的更多的权限。 我的脚本创建了一个过程来删除表/序列,执行该过程,然
我想恢复两个向量的第一个日期和相同向量的第二个日期之间的日期序列,.... 这是一个例子: dates1 = as.Date(c('2015-10-01', '2015-03-27', '2015-0
这个问题已经有答案了: sql ORDER BY multiple values in specific order? (12 个回答) 已关闭 9 年前。 我有一个 sql 语句,我想要ORDER
我想恢复两个向量的第一个日期和相同向量的第二个日期之间的日期序列,.... 这是一个例子: dates1 = as.Date(c('2015-10-01', '2015-03-27', '2015-0
在用java编写代码时,我需要用“],[”分割字符串。下面是我的代码。 try (BufferedReader reader = new BufferedReader(new InputStreamR
这个问题已经有答案了: Project Euler Question 14 (Collatz Problem) (8 个回答) 已关闭 9 年前。 我正在尝试查找数字的 Collatz 序列。以下
我有一个例程函数process_letter_location(const char& c, string &word)。 在我的 main 中,我声明了一系列字符串变量,如下所示: string s
我需要找到最长的多米诺骨牌链,给定一组 12 个随机挑选的多米诺骨牌。我已经递归地生成了多米诺骨牌的所有可能性(使用 0 到 12 的面值有 91 种可能性)。多米诺骨牌由一 block “砖 blo
我有这个数据结构 Seq,它继承了类 vector 但有一些额外的功能。使用这个数据结构 Seq 我有这个预定义的数据结构: typedef Seq > MxInt2d; 我现在想要一个包含多个 Mx
我是一名优秀的程序员,十分优秀!