gpt4 book ai didi

也处理 FeedBurner 的 Python RSS 解析器

转载 作者:太空狗 更新时间:2023-10-30 00:57:41 26 4
gpt4 key购买 nike

我正在为 RSS 提要编写一个 Python 解析器脚本。我正在使用 feedparser,但是,我一直在解析来自 FeedBurner 的提要。现在谁需要 FeedBurner?无论如何..

比如我找不到解析的方法

http://feeds.wired.com/wired/index

http://feeds2.feedburner.com/ziffdavis/pcmag

当我将它们放入 feedparser 库时,似乎不起作用。尝试将 ?fmt=xml 或 ?format=xml 放在 url 的末尾,但仍然没有得到 xml 格式。

我是否需要使用 BeautifulSoup 等 html 解析器来解析 FeedBurner 提要?最好有一个 python 公共(public)解析器或聚合器脚本来处理这个问题?

任何提示或帮助将不胜感激。

最佳答案

您可能遇到版本问题或 API 使用不当——查看您的错误消息会有所帮助。例如,以下适用于 Python 2.7 和 feedparser 5.0.1:

>>> import feedparser
>>> url = 'http://feeds2.feedburner.com/ziffdavis/pcmag'
>>> d = feedparser.parse(url)
>>> d.feed.title
u'PCMag.com: New Product Reviews'
>>> d.feed.link
u'http://www.pcmag.com'
>>> d.feed.subtitle
u"First Look At New Products From PCMag.com including Lab Tests, Ratings, Editor's and User's Reviews."
>>> len(d['entries'])
30
>>> d['entries'][0]['title']
u'Canon Color imageClass MF9280cdn'

还有另一个网址:

>>> url = 'http://feeds.wired.com/wired/index'
>>> d = feedparser.parse(url)
>>> d.feed.title
u'Wired Top Stories'
>>> d.feed.link
u'http://www.wired.com/rss/index.xml'
>>> d.feed.subtitle
u'Top Stories<img src="http://www.wired.com/rss_views/index.gif" />'
>>> len(d['entries'])
30
>>> d['entries'][0]['title']
u'Heart of Dorkness: LARPing Goes Haywire in <em>Wild Hunt</em>'

关于也处理 FeedBurner 的 Python RSS 解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5722963/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com