- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
想要了解 Netezza
或 Hadoop
是否是以下目的的正确选择:
从多个大小有时超过 GB 的在线资源中提取 feed 文件。
清理、过滤、转换和计算来自提要的更多信息。
生成不同维度的指标,类似于数据仓库立方体的做法,并且
使用 SQL 或任何其他标准机制帮助网络应用更快地访问最终数据/指标。
最佳答案
工作原理:
当数据加载到设备中时,它会智能地将 108 个 SPU 中的每个表分开。
通常,硬盘是计算机中速度最慢的部分。想象一下,其中 108 个同时旋转起来,加载一个小一 block 表。这就是 Netezza 如何实现每小时 500 GB 的加载时间。
在每个SPU(集成电路卡上的计算机)上加载并存储一张表后,每个分析列以获得描述性统计信息,例如最小值和最大值。这些值是存储在 108 个 SPU 中的每一个上,而不是索引,后者需要时间来创建、更新和占用不必要的空间。
想象一下您的环境无需创建索引。当需要查询数据时,设备内部的主计算机会查询 SPU 以查看哪个那些包含所需的数据。
只有包含适当数据的SPU返回信息,因此更少的信息通过网络移动到商业智能/分析服务器。对于加入数据,它变得更好。
Appliance 跨多个 SPU 分布多个表中的数据通过一把 key 。每个 SPU 包含多个表的部分数据。它在每个 SPU 上本地连接每个表的部分只返回本地结果。所有“本地结果”都在机柜内部组装,然后作为查询结果返回到商业智能/分析服务器。这种方法也有助于到速度的故事。
所有这一切的关键是“减少网络中的数据移动”。 Appliance 只返回数据需要通过组织的 1000/100 MB 网络返回到商业智能/分析服务器。
这与商业智能/分析软件通常使用的传统处理方式截然不同从数据库中提取大部分数据,在自己的服务器上进行处理。数据库做的确定所需的数据,将较小的子集结果返回给商业智能/分析服务器。
备份和冗余
要了解数据和系统是如何为几乎 100% 的正常运行时间设置的,重要的是要了解内部设计。它使用每个 400 GB 磁盘的外部、最快、三分之一的部分用于数据存储和恢复。三分之一的磁盘存储描述性统计数据,另外三分之一存储热数据备份其他 SPU。每个设备机柜还包含 4 个额外的 SPU,用于自动故障转移 108 个中的任何一个SPU。
取自 http://www2.sas.com
关于hadoop - netezza 是如何工作的?它与 Hadoop 相比如何?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4553712/
这个问题在这里已经有了答案: 11年前关闭。 Possible Duplicate: Haskell: difference between . (dot) and $ (dollar sign) 好
我对 Java 平台没有任何了解,我想知道可以使用哪些工具(和方法)来帮助开发用 Java 编写的可维护代码。 我知道可以使用: 适用于任何环境的敏捷方法 用于单元测试代码的 jUnit/jMock(
我们的产品需要支持 IE9,但我们一直假设 IE9 支持 IE10+ CSS 规则。 是否有一种巧妙的方法来获取在 IE10+ 中有效但在 IE9 中不受支持的所有 CSS 规则,目的是在静态代码分析
我需要为 MyString 类重载运算符 + 和 +=。 MyString.h class MyString { char* m_pStr; }; 主要
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在升级现有的旧代码以使用 VS 2019*,在代码中我有以下函数在返回行失败: int foo(const char *fn) const { ofstream out(fn,ios::b
我想使用 R2D3 pacakge 在 R 中,但我不确定这个包与 D3.js 库的关系。 R2D3 是否以任何方式限制 D3 的功能?我们可以将 R 中的所有 D3 功能和特性与 R2D3 一起使用
我正在使用 WPF 语音识别库,试图在桌面应用程序中使用它来替代菜单命令。 (我想专注于没有键盘的平板电脑体验)。它可以工作 - 有点,除了识别的准确性太差以至于无法使用。所以我试着听写到 Word。
我在学校参加数据库类(class)。老师给了我们一个简单的练习:考虑以下简单的模式: Table Book: Column title (primary key) Column gen
我正在尝试学习 MVVM 模式,特别是当 View 表示数据库表时该怎么做,但 View 有几个元素表示单个数据库字段。举个简单的例子: 假设我有一个 DateTime 类型的数据库字段(每个数据库字
我有两张 table 。表单有约 77000 行。日志约有 270 万行。 以下查询将在不到一秒的时间内返回“30198”: SELECT COUNT(DISTINCT logs.DOCID) FRO
当您在 Eviews 中进行回归时,您会得到一组这样的统计数据: 在 R 中有没有一种方法可以在一个列表中获得所有/大部分关于 R 回归的统计数据? 最佳答案 请参阅summary,它将为大多数回归对
如果我枚举 type XType int const ( X1 XType = iota X2 ... Xn ) var XTypeNames = []string{"x1", "x2
我正在试用 ranger R包加速做了很多randomForest计算。我正在检查我从中得到的预测,并注意到一些有趣的事情,因为所做的预测完全不正确。 以下是比较 randomForest 的可重现示
我发现 Clang 编译速度比 GCC 慢了四倍。知道是什么原因造成的吗? ebg@tsuki(250)$ time /usr/bin/cc -DHC4 -DSAFETY -DNOREDUCE -DN
我注意到在尝试以 JSON 格式发布表单数据时,以下内容不起作用: $.ajax({ type: "POST", url: url, data: JSON.string
我的代码库中有很多 #if DEBUG/#endif 语句,它们大多具有断言类型逻辑,我不敢在生产环境中运行这些逻辑。 [Conditional("DEBUG")] public void Check
所以我正在开发一个平方根计算器,但我不知道 while 循环是否比 do while 循环更适合。 double x, y = 1.0, newY, squareRoot; bool
我有两个列表,一个是所有语言,另一个是网站拥有的语言子集,我的想法是返回所有语言,但如果子集的元素对应于所有语言的列表,则更改 bool 值的属性. 语言的DTO: public class DTOL
以下控制台应用程序运行正常 - 我很惊讶它没有出错。 class DelegateExperiments { //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
我是一名优秀的程序员,十分优秀!