- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找一些关于我可能必须解决的工作问题的架构理念。
问题。
1) 我们的企业 LDAP 已成为一个“联系人大师”,充满了多年的陈旧数据以及未使用和未维护的属性。
2) 管理层已决定 LDAP 将不再用作公司电话簿。它仅用于授权目的。
3) 公司拥有数百个不同来源的联系人类型数据。我们需要清除 LDAP 中的所有垃圾,并为其他应用程序提供一个中央存储库来存储有关一个人的所有这些数据。
理想的目标
1)有一个单一的来源来存储关于一个人的所有各种属性
2)公司可能有 500k 人的信息(读取 500K 行)
3) 我估计这些人可能有 500 到 1000 个可选属性。 (阅读 500 多列)
4) 数据将主要通过 jms 上的 xml 设置/获取(这个基础设施已经到位)
5) 公司内的个别团体可以“拥有”栏目。只有他们被允许写入他们的列,他们将负责保持数据的清洁。
6) 应在亚秒内返回单个记录查找
7) 系统应在高峰时支持每小时 100 万个请求。
8) 主要目标是为企业提供实时数据,报告是次要目标。
9)我们是一家java、oracle、terradata的小店。我们是典型的大型 IT 商店。
我的想法:
1) 最初我认为 LDAP 可能会工作,但在添加新列时它不会扩展。
2)我的下一个想法是某种无 sql 解决方案,但从我所阅读的内容来看,我认为我无法获得所需的性能,而且它仍然相对较新。我不确定我能否让我的经理为这样一个关键项目签署类似的协议(protocol)。
3)我认为该解决方案将有一个元数据组件,它将跟踪谁拥有这些列以及每列代表什么,以及原始源系统。
感谢您的阅读,并提前感谢您的任何想法。
最佳答案
SQL
使用 Teradata 级工具,基于 SQL 的解决方案可能是可行的。我遇到了一个 article on database不久前讨论过的设计"anchor modeling" .
基本上,这个想法是创建一个单一的、哑的、合成的主键表,而所有真实或元数据都存在于其他表(子集)中,并通过外键 + 连接的方式附加。
我认为这种设计的好处是双重的。首先,出于组织或性能原因,您可以更轻松地划分数据存储。其次,您只需为在任何给定子集中具有数据的记录创建额外的行,因此您使用的空间更少,索引和搜索速度更快。
子集可能基于维护者或其他一些标准。 XML 设置/获取将是每个子集/记录(而不是全局记录)。可以组合和缓存给定记录的所有子集。可以为元数据、搜索索引等创建其他子集,并且可以独立查询这些子集。
NoSQL
NoSQL 看起来类似于 LDAP(至少在理论上),但一个好的 NoSQL 工具的好处将包括对元数据、版本控制和组织的更大抽象。事实上,从我所读到的内容来看,NoSQL 数据存储似乎旨在解决您提出的与扩展和松散结构数据有关的一些问题。有a good question on SO regarding datastores .
生产 NoSQL
另一方面,有少数大公司在大规模环境中使用 NoSQL,例如 Google's Bigtable .它似乎是完美的工具:
6) a single record lookup should be returned in sub seconds
7) system should support 1 million requests per hour at peak.
关于web-services - 具有高度动态数据的高吞吐量服务的案例研究或示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3455168/
这个问题在这里已经有了答案: Oracle: merging two different queries into one, LIKE & IN (1 个回答) 8年前关闭。 我有以下代码: case
我查阅过此页面:http://dev.mysql.com/doc/refman/5.1/en/case.html以及这个,但无法获得一个简单的程序来工作...... 更新:为了明确我想要做什么:我想从
有什么办法可以优化下面的查询吗? SELECT DATE_FORMAT(a.duedate,'%d-%b-%y') AS dte, duedate, SUM(CASE WHEN (typeofnoti
我进退两难,以下 SQL 查询的结果是什么以及它是如何工作的: SELECT ... CASE WHEN (a.FIELD=1 AND b.FIELD=2) THEN 1 WHEN
问题:输入年,月,打印对应年月的日历。 示例: 问题分析: 1,首先1970年是Unix系统诞生的时间,1970年成为Unix的元年,1970年1月1号是星期四,现在大多的手机的日历功能只能显
**摘要:**介绍了Angular中依赖注入是如何查找依赖,如何配置提供商,如何用限定和过滤作用的装饰器拿到想要的实例,进一步通过N个案例分析如何结合依赖注入的知识点来解决开发编程中会遇到的问题。 本
我想拥有自动伴侣类apply case 类的构造函数来为我执行隐式转换,但无法弄清楚如何这样做。我到处搜索,我能找到的最接近的答案是 this问题(我将解释为什么它不是我在下面寻找的)。 我有一个看起
您好,我已经浏览了“多列案例”问题,但没有看到与此相同的内容,所以我想我应该问一下。 基本上我有两个我想要连接的表(都是子查询的结果)。它们具有相同的列名称。如果我加入他们的 ID 和 SELECT
我发现了一些类型推断的非直觉行为。因此,语义等效代码的工作方式不同,具体取决于编译器推断出的有关函数返回类型的信息。当您在最小单元测试中重现此案例时,或多或少会清楚发生了什么。但我担心在编写框架代码时
CREATE TABLE test ( sts_id int , [status1] int , [status2] int , [status3] int , [status4] int ) INS
我有以下声明: SELECT Dag AS Dag, CASE Jaar WHEN 2013 THEN Levering END AS '2013', CASE
我想做的是为所有高于平均时间、平均时间和低于平均时间的游乐设施获取平均tip_portion。所以返回3行。当我运行它时,它显示: ERROR: missing FROM-clause entry
我正在尝试设置一个包含以下字段的报告: 非常需要报告来显示日期、该日期内的总记录(因此我按日期分组),然后按小时计算 12 小时工作日(从上午 8 点到晚上 8 点)我需要计算记录在这些时间内出现的时
我有这个查询 SELECT users.name FROM users LEFT JOIN weapon_stats ON users.id = weapon_stats.zp_id WHERE we
我正在尝试按收视率等级获取不同视频的计数。我有下表: vid_id views 1 6 1 10 1 900 2 850 2 125000
假设我有一个如下所示的 SQL 语句: select supplier, case when platform in (5,6) then 'mobile' when p
我有一个表测试 TestNumber (int primary key) InactiveBitwise (int) 我执行以下命令: UPDATE tests SET CASE WH
我有一个像这样的表(name=expense): id amount date 1 -1687 2014-01-02 00:00:00.0 2 11000 2014-01-02 0
我有一个 multimap 定义 typedef std::pair au_pair; //vertices typedef std::pair acq_pair; //ch qlty specifi
我有一个有点像枚举的类,它的每个实例都有一个唯一的 int 值,该值从 0 开始并在每个新实例时递增。 class MyEnumLikeClass { static int NextId =
我是一名优秀的程序员,十分优秀!