sql - 随时间重复消除-6ren

sql - 随时间重复消除

转载作者：行者123 更新时间：2023-11-29 13:39:29

24

4

我为我的智能家居创建了一个数据库，但我在编程过程中犯了一个错误:应用程序将内容两次发布到数据库中。我想删除所有包含重复项的行。对于重复，我的意思是一个元组，数据中的内容与同一类型的最后一个相同。我在这个例子中用“<<”标记重复项，请同时注意最后 3 行。我想保留第一个新数据，所以我想删除它们之后的所有重复数据。我仍然希望你能帮助我解决我的问题。

SmartHome=# select * from sensordata order by time desc Limit 21;
 type | data |            time
------+------+----------------------------
    8 | 2459 | 2019-08-09 23:10:39.530087 << 
    8 | 2459 | 2019-08-09 23:10:39.356908
    8 | 2445 | 2019-08-09 23:05:39.933269 <<
    8 | 2445 | 2019-08-09 23:05:39.789173
   10 | 6105 | 2019-08-09 22:50:50.40792  <<
   10 | 6105 | 2019-08-09 22:50:50.096132
    8 | 2459 | 2019-08-09 22:50:41.429681 <<
    8 | 2459 | 2019-08-09 22:50:41.357483
    8 | 2474 | 2019-08-09 22:45:42.13396  <<
    8 | 2474 | 2019-08-09 22:45:41.813046
   10 | 6221 | 2019-08-09 22:40:51.107709 <<
   10 | 6221 | 2019-08-09 22:40:51.076903
   10 | 6105 | 2019-08-09 22:35:51.737255 <<
   10 | 6105 | 2019-08-09 22:35:51.544886
   10 | 6221 | 2019-08-09 22:30:52.493895 <<
   10 | 6221 | 2019-08-09 22:30:51.795203
    8 | 2459 | 2019-08-09 22:30:43.193447 <<
    8 | 2459 | 2019-08-09 22:30:43.045599
   10 | 6105 | 2019-08-09 22:25:52.571793 << Duplicate like them above
   10 | 6105 | 2019-08-09 22:25:52.442844 << Also a Duplicate with much more
   10 | 6105 | 2019-08-09 22:20:51.356846    time between the rows
(21 rows)

SmartHome=# \d sensordata
                   Table "public.sensordata"
 Column |            Type             |       Modifiers
--------+-----------------------------+------------------------
 type   | integer                     | not null
 data   | character varying(20)       | not null
 time   | timestamp without time zone | not null default now()
Indexes:
    "smarthome_idx" UNIQUE, btree (type, "time")
Foreign-key constraints:
    "sensordata_type_fkey" FOREIGN KEY (type) REFERENCES sensortype(id)

如果我跑

with a as (Select *, row_number() over(partition by type,data order by time) from sensordata) select * from a where row_number=1 order by time desc;

输出是:

 10 | 17316 | 2019-08-09 09:43:46.938507 |          1
   10 | 18276 | 2019-08-09 09:38:47.129788 |          1
   10 | 18176 | 2019-08-09 09:33:47.889064 |          1
   10 | 17107 | 2019-08-08 10:36:11.383106 |          1
   10 | 17921 | 2019-08-08 09:56:15.889191 |          1
   10 | 17533 | 2019-08-03 09:30:11.047639 |          1

那不是我的意思:/(ß抱歉不知道如何以这种方式在评论中将这些东西标记为代码块

最佳答案

有很多方法可以做到这一点。最快的通常是相关子查询，但我永远记不起语法，所以我通常使用窗口函数，特别是 row_number()。

如果你跑

Select *, row_number() over(partition by type,data order by date) from sensor data

这应该给出您的表的一个版本，其中您要保留的所有行的编号为 1，重复项的编号为 2、3、4...在删除查询中使用相同的字段，您将被排序.

编辑:我现在明白您只想删除同一类型中连续出现的重复项。这也可以使用 row_number 和 join 来实现。此查询应该只为您提供所需的数据。

WITH s as (SELECT *,row_number() over(partition by type order by date) as rnum from sensordata)
SELECT a.* 
FROM s a 
JOIN s b 
ON a.rnum=b.rnum+1 AND a.type=b.type
WHERE NOT a.data=b.data

如果这很重要，这可能需要稍微调整以避免错过第一个条目。

关于sql - 随时间重复消除，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57437342/

24

4

0

文章推荐： postgresql - 使用scala将多个数据帧插入函数中的postgres表

文章推荐： mysql - 什么是 Jooq 事务隔离级别？脏读会发生吗？

文章推荐： PHP + PostgreSQL + ODBC - UTF8 - 变音符号问题

vba - 消除/更改循环以加快代码速度
我编写了一些运行速度很慢的 VBA 代码。我的代码中有一系列不同的循环。我知道循环并不总是处理数据的最有效方式，所以我认为它们是问题所在。我需要有关如何更改或消除循环的想法，以便加快代码的运行时间。
php - 消除？来自表单帖子上的查询字符串
我目前有一个网址:http://testsite.local/search/?q=findme一旦有人查询，我的搜索页面。我使用 mod_rewrite 重写了一些页面，想知道是否可以将其变成一个不错
mysql - 如何排除有重复的行？ (消除)
有人可以帮助我执行一个查询，其中查询的重复元素被删除 Select * from table where APPNAME = 'Ap1' or APPNAME= 'Ap2' 使用 DISTINCT 的
linux - 消除。从查找的结果
我正在尝试在 ubuntu 上使用以下命令在一个文件夹中查找文件并通过 FFmpeg 提供并输出到另一个文件夹。问题是当它处理输出路径和文件名时，它添加了一个 .像这样的路径:/conversions
r - 消除 R 中的重复项
这个问题在这里已经有了答案: How can I remove all duplicates so that NONE are left in a data frame? (3 个答案) 关闭 1
coq:消除 forall 量词
我想证明以下定理: Theorem Frobenius (A: Set) (q: Prop) (p: A -> Prop) : (q \/ forall x : A, p x) -> (foral
php - 消除 Excel 文档的缓存
我有一个 PHP 脚本，它只需要一些数据，将其分隔为制表符分隔格式，将其保存为 .xls 文件，然后为用户提供下载链接。大多数情况下运行良好，但有些人正在获取导出的 .xls 文件的缓存版本。我想
r - 消除 R 中的异常数据点
我有一个看起来有点像这个可重现代码的数据框，我想删除每列的异常值(在我们的例子中，数据点低于或高于平均值 2.5 个标准偏差)而不删除整个主题/行。 Subj mn + sd * 2.5) | (x
c++ - 消除 C++ 中多余的模板参数
我正在尝试编写一个实现 fmap 的演示。在 Haskell 中与 continuation ，我的代码如下所示: #include #include template using Callba
Highcharts 消除 xAxis 开始和第一个值之间的差距
在此 HighCharts例如，如何消除 xaxis 开始位置与 Jan 的刻度位置之间的差距。 http://jsfiddle.net/gh/get/jquery/1.7.2/highslide-s
delphi - 消除 TSpeedButton 的闪烁
重现步骤: 将TPanel添加到新的VCL表单并设置Align = alClient。将 TSpeedButton 添加到面板，并将一些 bmp 图像分配给 Glyph 属性。 (可选，但更清晰:F
javascript - 消除 javascript 数组中的元素
我得到一个 JavaScript 数组，其中包含一定数量(未指定)的各种元素(字符串、数字、 bool 值)。我需要消除字符串和 bool 值。我应该如何处理它？我应该使用typeof吗？最佳答案
excel - 消除(可选)空格后的所有字符的公式
我正在寻找一个公式，可以消除字符串中空格后的空格和无用字符。我的第一 react 是执行以下操作:=LEFT(A1,FIND("",A1)) 它适用于所有有空格的情况但是如果单元格中没有空格，我的
javascript - 消除 Javascript 中的按键延迟
我有以下问题:我正在尝试编写一个 Javascript 游戏，并且 Angular 色由箭头键控制。问题是，当一个人按住按键时，在触发第一个按键和重复的按键之间存在短暂的延迟。另外，当按下“向右箭
PowerShell ForEach-Object 消除
让我们考虑一个集合的集合，以及需要在管道内对内部集合的每个元素执行的操作。为了简单起见，让它成为一个数组数组，操作简单的打印到屏幕上。为了表达我的问题，让我们还有一个元素不是集合的数组: $Arra
chapel - 消除 Chapel 构建中源文件的歧义
跟进this question关于包含源文件。我包括一个 Chapel 模块，其中包含一个名为 classes.chpl 的文件。，但我当前的项目也有一个 classes.chpl 。正确的消歧模式
assembly - 消除 Intel 语法中寄存器名称中标签的歧义
我想知道如何在英特尔语法中的某些指令中区分标签名称和寄存器名称。例如，call rdx通常意味着间接跳转，但是如果我们在同一个汇编文件中有一个标签rdx怎么办？我相信它可以被解释为直接跳转到 rdx
javascript - 消除 HTML 弹出窗口的延迟
据我了解，Chrome 会异步运行整个程序，这会导致我的扩展程序在单击后大约 2 秒后打开。有没有办法强制扩展程序显示带有“正在加载”消息的 html 页面，然后完成加载 javascript 并用内
sqlite - 消除 sqlite 中的唯一约束错误
我正在将 CSV 加载到 sqlite 数据库，如下所示: sqlite3 /path/to/output.db /dev/null 或者，您可以自己生成 SQL 命令，以便可以使用 INSERT 或
haskell - 消除 cabal 文件中的重复内容
我的 .cabal 文件的许多节中经常有类似的属性。例如 Library x ... ghc-options: -O2 -Wall -fno-warn-missing-s

首页

博学

6Ren·AI

商城

sql - 随时间重复消除