gpt4 book ai didi

python - 使用 feedparser 按日期限制 RSS 元素。 [Python]

转载 作者:太空宇宙 更新时间:2023-11-03 13:53:37 25 4
gpt4 key购买 nike

我像这样迭代 RSS 提要,其中 _file 是提要

d = feedparser.parse(_file)
for element in d.entries:
print repr(element.date)

日期输出是这样的

u'Thu, 16 Jul 2009 15:18:22 EDT'

我似乎无法理解如何实际量化上述日期输出,因此我可以使用它来限制提要元素。所以我要问的是如何从中获得实际时间,所以我可以说如果大于 7 天,则跳过此元素。

最佳答案

feedparser 应该从 Python 的时间模块中为您提供一个 struct_time 对象。我猜它无法识别该日期格式,因此无法为您提供原始字符串。

请参阅此处了解如何添加对解析格式错误的时间戳的支持:

http://pythonhosted.org/feedparser/date-parsing.html

如果你设法让它给你 struct_time,你可以在这里阅读更多相关信息:

http://docs.python.org/library/time.html#time.struct_time

struct_time 对象拥有您需要的一切。他们有这些成员:

time.struct_time(tm_year=2010, tm_mon=2, tm_mday=4, tm_hour=23, tm_min=44, tm_sec=19, tm_wday=3, tm_yday=35, tm_isdst=0)

我通常将结构转换为秒,如下所示:

import time
import calendar

struct = time.localtime()
seconds = calendar.timegm(struct)

然后您可以通过常规数学运算来查看已经过去了多少秒,或者使用 datetime 模块来计算时间增量。

关于python - 使用 feedparser 按日期限制 RSS 元素。 [Python],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2204858/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com