gpt4 book ai didi

mdx - 是否有(开源)基于 MDX 的内存中 OLAP 服务器?

转载 作者:行者123 更新时间:2023-12-04 04:34:55 26 4
gpt4 key购买 nike

关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。












想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。

3年前关闭。




Improve this question




我想知道是否有 内存中 可以处理 MDX 的 OLAP 服务器。

我找到了 Wikipedia article .
但它没有说明内存中的功能......

我唯一知道的一个是 Mondrian,它也是上面 wiki 文章中提到的两个开源解决方案之一。

到现在为止,我只是和 Mondrian 合作过一点……我不认为 Mondrian 是真正的内存中 OLAP 服务器。

原因如下:

它有一个内存缓存,其中包含查询结果。但是它们的第一次执行需要很长时间并且必须从 RDBMS 加载。 ( http://mondrian.pentaho.com/documentation/faq.php#Scalability )

我认为更好的方法是:

将所有事实表和维度表加载到 Cache 中,然后对该内存中的数据执行每个查询。

AFAIK,甲骨文今年将在 12c 企业版中发布一些(或全部)表在内存中的可能性。这将加速 OLAP 服务器,它只使用 SQL 查询 RDBMS 事实表。

...但企业版非常昂贵...

我想听听其他人对此的看法。

此致,

丹尼斯。

最佳答案

在 ActiveViam,我们开发了 Sparkube 是 Apache Spark 的扩展,它将任何 Apache Spark 数据集公开为 OLAP 多维数据集,您可以使用 MDX 从 Excel 数据透视表、Tableau 软件或 ActiveUI(直接嵌入 Sparkube 中的 Web 前端)进行查询。聚合分布在 Spark 集群中,并在内存中动态执行。

http://activeviam.com/sparkube

Sparkube 中的 MDX 引擎是我们在商业 ActiveViam 分析平台上开发的引擎,因此它被许多人使用和测试。

例如,以下是如何将 CSV 文件的内容装入内存并将其公开为多维立方体的方法:

// Load a file into a Spark dataset.
// Here we load a CSV file, get the column names from
// the CSV headers, and use Spark automatic type inference.
var ds = spark.read
.format("csv")
.option("header","true")
.option("inferSchema","true")
.load("path/to/file.csv")

// Import the sparkube library (the sparkube jar must be in the classpath)
import com.activeviam.sparkube._

// Expose the dataset as a multidimensional cube.
// You can start visualizing the cube right away at http://localhost:9090/ui
// or connect from Excel with the XMLA protocol at http://localhost:9090/xmla
new Sparkube().fromDataset(ds)
.withName("My first cube")
.expose()

关于mdx - 是否有(开源)基于 MDX 的内存中 OLAP 服务器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25914872/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com