gpt4 book ai didi

c# - SQL 或 C# 的配对速度更快吗?

转载 作者:太空狗 更新时间:2023-10-30 00:55:02 24 4
gpt4 key购买 nike

我有很多数据需要根据一些简单的标准进行配对。有一个时间窗口(两条记录都有一个 DateTime 列),如果一条记录与另一条记录在时间上非常接近(在 5 秒内)则它是潜在匹配,时间上最接近的记录被认为是完全匹配。还有其他字段也有助于缩小范围。

我写了一个存储过程,它在返回之前在服务器上进行匹配完整、匹配的数据集到 C# 应用程序。我的问题是,提取 100 万 (x2) 行并在 C# 中处理它们会更好,还是 sql server 更适合执行此匹配?如果是 Sql server,那么使用日期时间字段配对数据的最快方法是什么?

现在我选择表 1/表 2 中的所有记录到临时表中,遍历表 1 中的每条记录,在表 2 中查找匹配项并将匹配项(如果存在)存储在临时表中,然后我删除它们自己的临时表中的两条记录。

为了我正在编写的游戏,我不得不匆忙完成这篇文章,所以请原谅糟糕(非常糟糕)的程序......它有效,只是效率低得可怕!整个 SP 在 pastebin 上可用:http://pastebin.com/qaieDsW7

我知道 SP 写得不好,所以说“嘿,笨蛋……写得更好”没有帮助!我正在寻求改进它的帮助,或者关于我应该如何以不同的方式做整件事的帮助/建议!我有大约 3/5 天的时间来重写它,我可以将截止日期推迟一点,但如果你们能及时帮助我,我宁愿不这样做! :)

谢谢!

最佳答案

最终,在 99% 的情况下,在数据库端编译数据是更可取的,因为它专为数据处理而设计(通过使用索引、关系等)。您的许多代码可以通过使用连接来以您需要的格式完全编译数据来合并。事实上,您可以完全绕过几乎所有的临时表,而只需填充一个主事件临时表。

一般模式是这样的:

INSERT INTO #Events
SELECT <all interested columns>
FROM
FireEvent
LEFT OUTER JOIN HitEvent ON <all join conditions for HitEvent>

通过这种方式,您可以将所有触发事件与零个或多个 HitEvent 匹配。在我们聊天讨论之后,您甚至可以通过将其包装在子查询中并使用窗口函数将其限制为零个或一个命中事件 ROW_NUMBER() OVER (PARTITION BY HitEvent.EventID ORDER BY ...) AS HitRank 并将 WHERE HitRank = 1 添加到外部查询。这最终就是您最终所做的并获得了您期望的结果(在此过程中需要一些工作和学习)。

关于c# - SQL 或 C# 的配对速度更快吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10806916/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com