gpt4 book ai didi

python - 强制 feedparser 清理所有内容类型

转载 作者:太空宇宙 更新时间:2023-11-03 19:22:08 28 4
gpt4 key购买 nike

对于一个项目,我想使用feedparser 。基本上我已经成功了。

在文档中section about sanitization据描述,并非所有内容类型都经过清理。如何强制 feedparser 对所有内容类型执行此操作?

最佳答案

我认为您引用的 feedparser 文档页面提供了很好的建议:

*建议您检查内容类型,例如条目[i].summary_detail.type。如果它是文本/纯文本,那么它还没有被清理(并且您应该在渲染内容之前执行 HTML 转义)。*

import cgi
import feedparser

d = feedparser.parse('http://rss.slashdot.org/Slashdot/slashdot')

# iterate through entries. If the type is not text/html, HTML clean it
for entry in d.entries:
if entry.summary_detail.type != 'text/html':
print cgi.escape(entry.summary)
else:
print entry.summary

当然,您可以通过多种方式迭代条目,具体取决于条目清理后您想要对它们执行的操作。

关于python - 强制 feedparser 清理所有内容类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9344700/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com