- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我已经使用 SqlAlchemy 创建了一个表,Record
。每条记录都有一个字段date
,它存储一个DateTime。我想查找日期晚于八小时前的所有记录。
我想出了四种编写过滤器的方法,所有方法都涉及比较当前时间、记录时间和八小时时间增量的简单算术。问题是:这些过滤器中有一半返回八小时窗口之外的行。
from sqlalchemy import Column, Integer, DateTime
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
from sqlalchemy import create_engine
import datetime
Base = declarative_base()
class Record(Base):
__tablename__ = 'record'
id = Column(Integer, primary_key=True)
date = Column(DateTime, nullable=False)
engine = create_engine('sqlite:///records.db')
Base.metadata.create_all(engine)
DBSession = sessionmaker(bind=engine)
session = DBSession()
#if the db is empty, add some records to the database with datetimes corresponding to one year ago and one hour ago and yesterday
now = datetime.datetime(2018, 4, 4, 10, 0, 0)
if not session.query(Record).all():
session.add(Record(date = now - datetime.timedelta(days=365)))
session.add(Record(date = now - datetime.timedelta(days=1)))
session.add(Record(date = now - datetime.timedelta(hours=1)))
delta = datetime.timedelta(hours=8)
#these are all equivalent to "records from the last eight hours"
criterion = [
(now - Record.date < delta),
(Record.date > now - delta),
(delta > now - Record.date),
(now - delta < Record.date),
]
for idx, crit in enumerate(criterion):
query = session.query(Record).filter(crit)
print("\n\nApproach #{}.".format(idx))
print("Generated statement:")
print(query.statement)
records = query.all()
print("{} row(s) retrieved.".format(len(records)))
for record in query.all():
print(record.id, record.date)
结果:
Approach #0.
Generated statement:
SELECT record.id, record.date
FROM record
WHERE :date_1 - record.date < :param_1
3 row(s) retrieved.
1 2017-04-04 10:00:00
2 2018-04-03 10:00:00
3 2018-04-04 09:00:00
Approach #1.
Generated statement:
SELECT record.id, record.date
FROM record
WHERE record.date > :date_1
1 row(s) retrieved.
3 2018-04-04 09:00:00
Approach #2.
Generated statement:
SELECT record.id, record.date
FROM record
WHERE :date_1 - record.date < :param_1
3 row(s) retrieved.
1 2017-04-04 10:00:00
2 2018-04-03 10:00:00
3 2018-04-04 09:00:00
Approach #3.
Generated statement:
SELECT record.id, record.date
FROM record
WHERE record.date > :date_1
1 row(s) retrieved.
3 2018-04-04 09:00:00
方法 1 和 3 是正确的 - 它们返回一小时前的记录,而不是一天前或一年前的记录。方法 0 和方法 2 是不正确的,因为它们除了返回一个小时前的记录外,还返回了一天前的记录和一年前的记录。
造成这种差异的原因是什么?我注意到 #1 和 #3 生成的语句仅参数化单个 datetime 对象,而 #0 和 #2 参数化 datetime 对象和 timedelta 对象。 timedeltas 是否以一种不寻常的方式参数化,这会使它们不适用于此类算术?
最佳答案
As noted by unutbu ,当 timedelta
对象用作不支持 native Interval
的数据库的绑定(bind)参数时类型,它们将转换为相对于“纪元”(1970 年 1 月 1 日)的时间戳。 SQLite 就是这样一个数据库,MySQL 也是。 .当您打开日志记录时,另一个值得注意的事情是 datetime
值为 stored and passed as ISO formatted strings .
A DATETIME column has NUMERIC affinity在 SQLite 中,但由于 ISO 格式的字符串不能无损地转换为数值,因此它们保留了它们的 TEXT 存储类。另一方面这很好,因为 3 ways to store date and time data在 SQLite 中是
- TEXT as ISO8601 strings ("YYYY-MM-DD HH:MM:SS.SSS").
- REAL as Julian day numbers, the number of days since noon in Greenwich on November 24, 4714 B.C. according to the proleptic Gregorian calendar.
- INTEGER as Unix Time, the number of seconds since 1970-01-01 00:00:00 UTC.
不过,当您尝试在数据库中执行算术运算时,事情会变得更有趣:
In [18]: session.execute('SELECT :date_1 - record.date FROM record',
...: {"date_1": now}).fetchall()
2018-04-04 20:47:35,045 INFO sqlalchemy.engine.base.Engine SELECT ? - record.date FROM record
INFO:sqlalchemy.engine.base.Engine:SELECT ? - record.date FROM record
2018-04-04 20:47:35,045 INFO sqlalchemy.engine.base.Engine (datetime.datetime(2018, 4, 4, 10, 0),)
INFO:sqlalchemy.engine.base.Engine:(datetime.datetime(2018, 4, 4, 10, 0),)
Out[18]: [(1,), (0,), (0,)]
原因是all mathematical operators cast their operands to NUMERIC storage class ,即使结果值是有损的——或者就此而言没有意义。在这种情况下,年份部分被解析,其余部分被忽略。
自 any INTEGER or REAL value is less与任何 TEXT 或 BLOB 值相比,结果整数值与给定 ISO 格式的区间字符串之间的所有比较都为真:
In [25]: session.execute(text('SELECT :date_1 - record.date < :param_1 FROM record')
...: .bindparams(bindparam('param_1', type_=Interval)),
...: {"date_1": now, "param_1": delta}).fetchall()
...:
2018-04-04 20:55:36,952 INFO sqlalchemy.engine.base.Engine SELECT ? - record.date < ? FROM record
INFO:sqlalchemy.engine.base.Engine:SELECT ? - record.date < ? FROM record
2018-04-04 20:55:36,952 INFO sqlalchemy.engine.base.Engine (datetime.datetime(2018, 4, 4, 10, 0), '1970-01-01 08:00:00.000000')
INFO:sqlalchemy.engine.base.Engine:(datetime.datetime(2018, 4, 4, 10, 0), '1970-01-01 08:00:00.000000')
Out[25]: [(1,), (1,), (1,)]
有些人可能将这一切称为有漏洞的抽象,但在 SQLAlchemy 中为数据库实现之间的所有差异提供解决方案将是一项艰巨的任务,或者说是不可能完成的任务。就我个人而言,我发现它不会妨碍使用,但允许按原样使用数据库的功能,但有一个很好的 Python DSL。如果您确实需要在单个代码库中支持不同数据库中的时间差异,请创建一个 custom construct使用合适的特定于数据库的编译器。
要实际计算 SQLite 中的差异并与给定 timedelta
中的总秒数进行比较,您 need to use the strftime()
函数,以便将 ISO 格式的字符串转换为自纪元以来的秒数。 julianday()
也可以,只要您也转换 Python datetime
并将结果转换为秒。将 2 个行为不当的比较替换为例如:
# Not sure if your times were supposed to be UTC or not
now_ts = now.replace(tzinfo=datetime.timezone.utc).timestamp()
delta_s = delta.total_seconds()
# Not quite pretty...
criterion = [
(now_ts - func.strftime('%s', Record.date) < delta_s,
(Record.date > now - delta),
(delta_s > now_ts - func.strftime('%s', Record.date)),
(now - delta < Record.date),
]
关于python - 为什么这个查询会根据我如何安排 DateTime 算法给出不同的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49654885/
滑动窗口限流 滑动窗口限流是一种常用的限流算法,通过维护一个固定大小的窗口,在单位时间内允许通过的请求次数不超过设定的阈值。具体来说,滑动窗口限流算法通常包括以下几个步骤: 初始化:设置窗口
表达式求值:一个只有+,-,*,/的表达式,没有括号 一种神奇的做法:使用数组存储数字和运算符,先把优先级别高的乘法和除法计算出来,再计算加法和减法 int GetVal(string s){
【算法】前缀和 题目 先来看一道题目:(前缀和模板题) 已知一个数组A[],现在想要求出其中一些数字的和。 输入格式: 先是整数N,M,表示一共有N个数字,有M组询问 接下来有N个数,表示A[1]..
1.前序遍历 根-左-右的顺序遍历,可以使用递归 void preOrder(Node *u){ if(u==NULL)return; printf("%d ",u->val);
先看题目 物品不能分隔,必须全部取走或者留下,因此称为01背包 (只有不取和取两种状态) 看第一个样例 我们需要把4个物品装入一个容量为10的背包 我们可以简化问题,从小到大入手分析 weightva
我最近在一次采访中遇到了这个问题: 给出以下矩阵: [[ R R R R R R], [ R B B B R R], [ B R R R B B], [ R B R R R R]] 找出是否有任
我正在尝试通过 C++ 算法从我的 outlook 帐户发送一封电子邮件,该帐户已经打开并记录,但真的不知道从哪里开始(对于 outlook-c++ 集成),谷歌也没有帮我这么多。任何提示将不胜感激。
我发现自己像这样编写了一个手工制作的 while 循环: std::list foo; // In my case, map, but list is simpler auto currentPoin
我有用于检测正方形的 opencv 代码。现在我想在检测正方形后,代码运行另一个命令。 代码如下: #include "cv.h" #include "cxcore.h" #include "high
我正在尝试模拟一个 matlab 函数“imfill”来填充二进制图像(1 和 0 的二维矩阵)。 我想在矩阵中指定一个起点,并像 imfill 的 4 连接版本那样进行洪水填充。 这是否已经存在于
我正在阅读 Robert Sedgewick 的《C++ 算法》。 Basic recurrences section it was mentioned as 这种循环出现在循环输入以消除一个项目的递
我正在思考如何在我的日历中生成代表任务的数据结构(仅供我个人使用)。我有来自 DBMS 的按日期排序的任务记录,如下所示: 买牛奶(18.1.2013) 任务日期 (2013-01-15) 任务标签(
输入一个未排序的整数数组A[1..n]只有 O(d) :(d int) 计算每个元素在单次迭代中出现在列表中的次数。 map 是balanced Binary Search Tree基于确保 O(nl
我遇到了一个问题,但我仍然不知道如何解决。我想出了如何用蛮力的方式来做到这一点,但是当有成千上万的元素时它就不起作用了。 Problem: Say you are given the followin
我有一个列表列表。 L1= [[...][...][.......].......]如果我在展平列表后获取所有元素并从中提取唯一值,那么我会得到一个列表 L2。我有另一个列表 L3,它是 L2 的某个
我们得到二维矩阵数组(假设长度为 i 和宽度为 j)和整数 k我们必须找到包含这个或更大总和的最小矩形的大小F.e k=7 4 1 1 1 1 1 4 4 Anwser是2,因为4+4=8 >= 7,
我实行 3 类倒制,每周换类。顺序为早类 (m)、晚类 (n) 和下午类 (a)。我固定的订单,即它永远不会改变,即使那个星期不工作也是如此。 我创建了一个函数来获取 ISO 周数。当我给它一个日期时
假设我们有一个输入,它是一个元素列表: {a, b, c, d, e, f} 还有不同的集合,可能包含这些元素的任意组合,也可能包含不在输入列表中的其他元素: A:{e,f} B:{d,f,a} C:
我有一个子集算法,可以找到给定集合的所有子集。原始集合的问题在于它是一个不断增长的集合,如果向其中添加元素,我需要再次重新计算它的子集。 有没有一种方法可以优化子集算法,该算法可以从最后一个计算点重新
我有一个包含 100 万个符号及其预期频率的表格。 我想通过为每个符号分配一个唯一(且前缀唯一)的可变长度位串来压缩这些符号的序列,然后将它们连接在一起以表示序列。 我想分配这些位串,以使编码序列的预
我是一名优秀的程序员,十分优秀!