MySQL 排除指定时间内重复记录的解决方案
在实际的数据库操作中,我们经常需要排除时间间隔小于一定范围(例如 5 分钟)的重复记录。本文总结了几种实现这一需求的 MySQL 解决方案。
表结构
假设我们有一张记录数据的表 event_logs
,其结构如下:
CREATE TABLE event_logs (
id INT PRIMARY KEY AUTO_INCREMENT,
event_time DATETIME NOT NULL
);
-- 插入测试数据
INSERT INTO event_logs (id, event_time) VALUES
(1, '2025-01-01 12:00:00'),
(2, '2025-01-01 12:04:59'),
(3, '2025-01-01 12:05:00'),
(4, '2025-01-01 12:10:00');
该表包含以下字段:
id
:记录的唯一标识符。event_time
:记录的时间戳。
以下是测试数据:
id | event_time |
---|---|
1 | 2025-01-01 12:00:00 |
2 | 2025-01-01 12:04:59 |
3 | 2025-01-01 12:05:00 |
4 | 2025-01-01 12:10:00 |
背景
我们的需求是从该表中排除 5 分钟内的重复记录,保留的记录具有如下特征:
- 第一条记录始终保留。
- 后续记录与上一次保留记录的时间差至少为 5 分钟。
以下是实现这一需求的几种方案。
方案 1:通过时间戳计算过滤记录
这个方案通过将时间戳转换为整数并按固定时间间隔分组,从而排除 5 分钟内的重复记录。然而,这种方法在边界条件下可能出现误差,比如当两个记录的时间都接近 5 分钟的边界时,可能会错误地将两个记录都保留。
SQL 实现
SELECT
id,
event_time
FROM (
SELECT
id,
event_time,
FLOOR(UNIX_TIMESTAMP(event_time) / (5 * 60))