- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的每台 PC 每月有 1,000,000 行由某些监控软件生成。 DataToImport(临时)表如下所示:
EventID int NOT NULL (Primary Key of denormalized table)
EventType int NOT NULL -- A enumerated value
Computer nvarchar(50) NOT NULL -- Usually computer name
When DateTime NOT NULL
FileRef int NOT NULL -- File generators reference
FileDesc nvarchar(100) NOT NULL -- Humanly-readable description
FilePath nvarchar(100) NOT NULL -- Relative Path on disk
我正在尝试将这些数据标准化为几个表:
Computer (UniqueID, Name)
File (UniqueID, FileRef, FileDesc, FilePath)
Event (ID, Type, ComputerUniqueID, When, FileUniqueID)
..这样“事件”将有无数行,但它们非常小,因此数据库大小是可以管理的,并且可以为表建立索引以提高查询性能:
-- Grab new computers
INSERT INTO Computer
SELECT [Computer] AS [Name]
FROM [DataToImport]
WHERE [DataToImport].[Computer] NOT IN (SELECT [Name] FROM [Computer])
-- Grab new files
INSERT INTO File
SELECT [FileRef], [FileDesc], [FilePath]
FROM [DataToImport]
WHERE [FileRef] NOT IN (SELECT [FileRef] FROM File)
-- Normalize rows
INSERT INTO Event
SELECT [EventID], [EventType], [Computer].[UniqueID], [File].[UniqueID]
FROM [DataToImport]
INNER JOIN [Computer] ON [DataToImport].[Computer] = [Computer].[Name]
INNER JOIN [File] ON [DataToImport].[FileRef] = [File].[FileRef]
..这一切看起来都很棒,除了三元组(FileRef、FileDesc、FilePath)实际上是一个复合键,因为这三个项目中的任何一个都可以变化,并且这代表一个唯一的条目。我需要提取不同三元组来插入它们...
-- Grab new distinct files
INSERT INTO File
SELECT DISTINCT [FileRef], [FileDesc], [FilePath]
FROM [DataToImport]
WHERE [FileRef] NOT IN (errrrr....help!)
如何确保唯一的文件行标准化?
最佳答案
我会用
INSERT [File] ([FileRef], [FileDesc], [FilePath])
select distinct [FileRef], [FileDesc], [FilePath]
from [DataToImport]
except select [FileRef], [FileDesc], [FilePath]
from [File]
...但我首先将其性能与 Quassnoi 的 SELECT...INTERSECT 解决方案进行比较。
关于sql - 使用 DISTINCT 标准化数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2875496/
我有一个包含电子邮件、IP、州、城市、时间戳、ID 列的表 我需要按州分组计算电子邮件和 IP 的不同位置 所以当我运行 MYSQL 查询时, select State, City ,count(di
我试过 select distinct ID from DB.TABLE; 它返回所有记录中的唯一 ID。 select distinct * from DB.TABLE; 它将通过比较所有列
我正在尝试在 Postgresql 中编写一个查询,该查询提取一组有序数据并按不同的字段对其进行过滤。我还需要从同一表行中提取其他几个字段,但需要将它们排除在不同的评估之外。示例: SELECT
我有一个使用以下语句创建的 Postgres 表。该表由另一个服务的数据转储填充。 CREATE TABLE data_table ( date date DEFAULT NULL,
我在一个名为 products 的表中有 4 列 id|p_name| p_img | 1 | Xs | xsmax.png | 2 | Xs | xr.png |
当它的状态仅为"is"时,我想从“num”中选择不同的值,而不是立即包括“否”? 表: +--------+-----+--------+ | id | num | status | +---
全部!今天我有一个棘手的问题要给你,我想使用 select DISTINCT 语句来选择一个需要不同的行,但也在同一个语句中(或者我尝试过的方式?)一个没有的行't/不能区分。我想要的结果是每个类名中
我有一个正在使用 Distinct() 的 linq 查询。如果我只是调用 Distinct() 而没有转换为列表,那么它不会返回不同的列表 - 它仍然包含重复项。 但是,如果我转换为 List 并然
说到性能,我应该使用 .ToList().Distinct() 还是 .Distinct().ToList() ? 两种扩展方法是否生成相同的 SQL 查询? 看起来第二种方法应该表现更好,但这是真的
如何在不支持 SQL Server 2008R2 的 SQL 实现中重写包含标准 IS DISTINCT FROM 和 IS NOT DISTINCT FROM 运算符的表达式? 最佳答案 IS DI
有一张 table (在 HIVE) 示例 - meanalytics.key2_master_ids 该表有 6 列(cmpgn_id、offr_id、exec_id、creatv_id、cmpl_
SELECT * FROM `amc_info` WHERE department =' ( SELECT DISTINCT department ) into outfile = 'Differe
如何在Elasticsearch中计算“不同的平均值”?我有一些这样的非规范化数据: { "record_id" : "100", "cost" : 42 } { "record_id" : "200
关注这个question我有... ID SKU PRODUCT ======================= 1 FOO-23 Orange 2 BAR
我有这个 mysql 查询: SELECT DISTINCT post.postId,hash,previewUrl,lastRetrieved FROM post INNER JOIN (tag a
http://sqlfiddle.com/#!2/37dd94/17 如果我执行 SELECT DISTINCT,我得到的结果与只执行 SELECT 的结果相同。 在查询结果中,您将看到两个包含 Di
我有一列包含空条目,例如此列中的可能值为 None, 1, 2, 3 当我使用 session.query(func.count(distinct(Entry.col))).scalar() 计算列中
这是否可能从表列中选择不同的行并计算单个查询中每个不同字段的重复行 $sql = "SELECT DISTINCT location and COUNT(DISTINCT location)
我在 MySQL 数据库中有一个包含 1100 万行的表。其中一列是个人身份证号码。人们在表中被多次列出,我想知道有多少个唯一的个人 ID 号码。然后创建一个包含这些唯一数字的表格。当我计算列中不同的
我刚刚注意到我的 Informix SQL 列(在同一个表中)的某些 上有些奇怪。当我执行此查询时 SELECT DISTINCT colName FROM myTable 例如,我得到 40 行。但
我是一名优秀的程序员,十分优秀!