- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在寻找一个库来从文本文件中找到主键。想象一下,我有一个 CSV 文件,但我不知道哪一列是主键。有没有图书馆可以帮助我做到这一点(使用某种启发式方法)?
最佳答案
我相信不知道文件中的哪个字段(如果有的话)是主键不是编程问题,而是业务问题。这是我会发回公司以获得答案的东西。原因如下。
首先,预期为主键但不在文件的特定版本中的内容通常表明该文件存在问题,不应对其进行处理。例如,在我的工作中,我经常需要处理可能以 CSV 格式提供的销售名册。在它们中,任何销售销售区域都应该是唯一的。这是商业规则。有时我们得到的花名册不是唯一的,但我们无法导入,因为两个人不能同时分配到同一地区。通常是一个人离开另一个人代替他的问题,但是我们无法知道这两个记录中的哪一个是正确的。因此导入失败。但是,以编程方式检查包含此类信息的文件将无法将其作为 PK 找到,因为它在文件中不是唯一的,而它应该是唯一的。
接下来,在首次处理文件时检查列中唯一数据的存在性并不能保证数据会随着时间的推移保持唯一性,或者它作为 PK 是有意义的。
例如,邮政编码在今天可能是唯一的,但三周后可能就不是了,因为有新人加入。
除非文件仅与邮政编码有关,否则邮政编码也不太可能成为候选 PK。
零件号是另一种情况,它可能看起来是唯一的但不在 CSV 文件中,因为来自不同制造商的零件可能具有相同的零件号,因此唯一性来自零件号和制造商的组合。但这又是一个商业规则,因为一些制造商可能对同一事物的不同版本使用相同的零件号,例如不同颜色的版本,而其他制造商可能有一个商业规则,它们是独一无二的。如果不知道数据对提供文件和使用数据的特定人员的意义,您就不知道它是否应该是 PK。
PK 的确定不仅仅与数据的唯一性有关,还与数据的含义有关。是的,您可以识别可能的 PK(然后像上面描述的第一种情况一样,您使用自动化工具可能会出错)进行检查,但您不应该在不解决数据含义的情况下自动选择一个。
关于database - 启发式查找文本文件中的主键,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31464485/
我听说过两种数据库架构。 大师级 主从 master-master不是更适合现在的web吗,因为它就像Git一样,每个单元都有整套数据,如果一个宕机也无所谓。 主从让我想起了 SVN(我不喜欢它),你
我们当前将 MySQL 配置为支持故障转移:Site1 Site2。当它们被设置为主/主时。在给定时间点,应用程序服务器仅主动写入一个站点。我们想要设置一个新的故障转移站点。然后我们将拥有 Site
我听说过两种数据库架构。 大师-大师 主从 master-master 不是更适合当今的网络吗,因为它就像 Git,每个单元都有整套数据,如果其中一个发生故障,也没关系。 主从让我想起 SVN(我不喜
我正在创建一个标记为类别的表,其中主类别(父列)包含 0,子类别包含父类别的 ID。我听说这叫引用。我的问题:这张表的结构正确吗?或者是否有更好的方法,例如实现遍历树或类似方法? CREATE TAB
我正在阅读一份关于 C++ 与 C 的文档。该文档说与 C 相比,C++ 编写得非常紧凑。一个例子是,C 允许 main() 函数类型为 void。另一方面,C++ 不允许这样做,他给出了标准中的以下
C main函数和Java main函数有什么区别? int main( int argc, const char* argv[] ) 对比 public static void main(Strin
我一直摸不着头脑,但运气不好。设计器有一个包含 3 栏的站点、两个侧边栏和一个主要内容区域。 专为桌面设计,左栏、主要内容、右栏。但是,在较小的设备上,我们希望首先堆叠主要内容。 所以通常情况下,你可
我一直在阅读有关 Jenkins 主/从配置的信息,但我仍然有一些问题: 是不是真的没有像 Jenkins 主站那样安装和启动从站 Jenkins?我假设我会以相同的方式安装一个主 Jenkins 和
据我了解,Viemodel中MVVM背后的概念包括业务逻辑和/或诸如暴露于 View 的数据的主/明细关系之类的事物 因此,正如我发现的那样,有很多ORM生成器,例如模型的telerik a.o以及另
我们有一个群集,其中包含3个主分区,每个主分区有2个副本。主/副本分片的总文档数相同;但是,对于同一查询/文档,我们得到3个不同的分数。当我们将preference = primary添加为查询参数时
我有一个非常大/旧/长时间运行的项目,它使用相对于启动目录的路径访问文件资源(即应用程序仅在从特定目录启动时才工作)。当我需要调试程序时,我可以从 eclipse 启动它并使用“运行配置”->->“工
谁能向我解释一下为什么我在这段代码上遇到段错误?我一直试图弄清楚这一点,但在各种搜索中却一无所获。当我运行代码而不调用 main(argc, argv) 时,它会运行。 Slave 仅将 argv 中
使用 xcode 中的默认项目作为主从应用程序,如果我在折叠委托(delegate)中放置 print 调试语句,当我旋转设备时它似乎永远不会被触发(事实上我永远无法触发它)。 我编辑的代码位于 Ap
是否有任何产品可以使 mysql 主/从故障转移过程更容易?一些可以自动发生的事情,而不是手动修复它。 最佳答案 [...稍后...;) 你所说的“更容易”是什么?MySQL 有很多解决方案: MyS
我有两个 mysql 数据库。我想做主/主复制。 复制以一种方式进行。然而,反过来说却不然。该错误表明它无法与用户“test@IPADDRESS”连接。 如何将用户名更改为 repl?从未进行过测试,
我正在尝试在 MySQL 中运行以下查询: GRANT REPLICATION SLAVE ON *.* TO 'replication'@’10.141.2.%’ IDENTIFIED BY ‘sl
我正在尝试使用 Android 提供的主/详细流程模板创建一个应用程序,并且我正在尝试将多个操作栏菜单项添加到操作栏的主要部分和详细信息部分。这就是我要实现的目标: (来源:softwarecrew.
我正在寻找一个跨平台的 C++ master/worker 库或工作队列库。一般的想法是我的应用程序将创建某种任务或工作对象,将它们传递给工作主机或工作队列,这将依次在单独的线程或进程中执行工作。为了
我似乎看到很多人在他们的 MySQL 模式中任意分配大尺寸的主/外键字段,例如 INT(11) 甚至 WordPress 使用的 BIGINT(20)。 如果我错了,请纠正我,但即使是 INT(4)
如果我有一个可以与多个键相关联的用户,正确的表设置应该是: 一个表有两列,例如: UserName | Key 没有主键且用户可以有多行,或者: 具有匹配标识符的两个表 Table 1 Us
我是一名优秀的程序员,十分优秀!