python - feedparser 无法获取 youtube 播放器-6ren

python - feedparser 无法获取 youtube 播放器

转载作者：太空宇宙更新时间：2023-11-04 09:12:48

25

4

我正在测试 feedparser 在我的 rss 提要上。它就像一个魅力，我得到了所有条目。

一些新闻有一个嵌入的 youtube 播放器，但这并没有出现在 feedparser 的返回值中。

我的代码很简单:

d = feedparser.parse('http://feeds.feedburner.com/NotciasPs3evita-Mypst')

返回(摘录):

 guidislink': False,
          'id': u'http://mypst.com.br/forum/index.php?/topic/17336-gamegen-call-of-duty-black-ops-2-ganha-trailer-com-acao-real-e-muitas-surpresas/',
          'link': u'http://mypst.com.br/forum/index.php?/topic/17336-gamegen-call-of-duty-black-ops-2-ganha-trailer-com-acao-real-e-muitas-surpresas/',
          'links': [{'href': u'http://mypst.com.br/forum/index.php?/topic/17336-gamegen-call-of-duty-black-ops-2-ganha-trailer-com-acao-real-e-muitas-surpresas/',
                     'rel': u'alternate',
                     'type': u'text/html'}],
          'published': u'Mon, 29 Oct 2012 14:53:58 +0000',
          'published_parsed': time.struct_time(tm_year=2012, tm_mon=10, tm_mday=29, tm_hour=14, tm_min=53, tm_sec=58, tm_wday=0, tm_yday=303, tm_isdst=0),
          'summary': u'A Activision revelou hoje um novo trailer de Call of Duty: Black Ops 2, substituindo as cenas de a\xe7\xe3o do jogo por cenas de a\xe7\xe3o na vida real. O trailer traz diversas \u201csurpresas\u201d e alguns zumbis.<br />\n<br />\n<br />\n<br />\nCall of Duty: Black Ops 2 chegar\xe1 no dia 13 de novembro nos Estados Unidos.<br />\n<br />\n<br />\n<em class="bbc"><strong class="bbc">Fonte: <a class="bbc_url" href="http://www.gamegen.com.br/playstation3/call-of-duty-black-ops-2-ganha-trailer-com-acao-real-e-muitas-surpresas/" rel="nofollow external" title="Link externo">GameGeneration</a></strong></em>',
          'summary_detail': {'base': u'http://feeds.feedburner.com/NotciasPs3evita-Mypst',
                             'language': None,
                             'type': u'text/html',
                             'value': u'A Activision revelou hoje um novo trailer de Call of Duty: Black Ops 2, substituindo as cenas de a\xe7\xe3o do jogo por cenas de a\xe7\xe3o na vida real. O trailer traz diversas \u201csurpresas\u201d e alguns zumbis.<br />\n<br />\n<br />\n<br />\nCall of Duty: Black Ops 2 chegar\xe1 no dia 13 de novembro nos Estados Unidos.<br />\n<br />\n<br />\n<em class="bbc"><strong class="bbc">Fonte: <a class="bbc_url" href="http://www.gamegen.com.br/playstation3/call-of-duty-black-ops-2-ganha-trailer-com-acao-real-e-muitas-surpresas/" rel="nofollow external" title="Link externo">GameGeneration</a></strong></em>'},
          'title': u'[GameGen] Call of Duty: Black Ops 2 ganha trailer com a\xe7\xe3o real e muitas surpresas',
          'title_detail': {'base': u'http://feeds.feedburner.com/NotciasPs3evita-Mypst',
                           'language': None,
                           'type': u'text/plain',
                           'value': u'[GameGen] Call of Duty: Black Ops 2 ganha trailer com a\xe7\xe3o real e muitas surpresas'}},

除了 youtube 播放器外，一切都已就绪 <object>标签。这是 feedparser 错误还是我的 rss 有问题？ python 上是否有其他库可以执行此操作？

最佳答案

提要解析器 sanitizes HTML input和 <object> , <param>和 <embed>标签默认被剥离。

您需要禁用清理(仅当您真正信任来源时)，或将 YouTube 标签列入白名单。

要禁用清理，请设置 SANITIZE_HTML错误:

feedparser.SANITIZE_HTML = False

要添加到白名单，将元素添加到_HTMLSanitizer.acceptable_elements设置:

_HTMLSanitizer.acceptable_elements.update(['object', 'param', 'embed'])

这两种方法都有固有的风险，您会以这种方式让自己受到攻击。我使用的方法是完全切换 sanitizer ，然后使用 some other method清理 HTML，可能使用 lxml.html.clean使用白名单并在 host_whitelist 中列出 YouTube .

关于python - feedparser 无法获取 youtube 播放器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13125833/

25

4

0

文章推荐： c++ - pclose() 不会给我进程退出代码

audio - 谁能解释语音命令如何通过 Android(Nexus 播放器)中的蓝牙 Remote (Nexus 播放器 Remote )工作？
谁能详细说明以下问题？蓝牙堆栈如何处理音频数据？如何处理音频命令？我们需要任何服务来处理音频数据吗？提前致谢。最佳答案基本上，通过 BLE 的语音命令需要: 一些用于减少所需带宽的音频编解
swift - 播放器 - 获取视频的当前时间
我正在使用Player库以实现全屏视频播放。我相信它在幕后使用 AVFoundation。我可以使用Float(self.player.maximumDuration)来实现视频的完整持续时间。但是
java - 宏记录器/播放器
我正在制作一种宏记录器/播放器我已经使用 java.awt.Robot() 等实用程序完成播放器部分，它模拟基本的人类鼠标/键盘输出命令，读取 XML 文件。我卡在了必须记录该 XML 文件的部分
youtube - 视频播放完毕后摆脱嵌入的 YouTube 播放器
我目前有以下代码可以在页面上播放 youtube 视频。 //Load player api asynchronously. var tag = document.createElement('s
flash - 基于嵌入式闪存的 mp3 播放器
我需要提供音频内容(但不是音乐，更像是播客；人类语音)，我正在考虑使用基于 Flash 的播放器让用户无需下载即可收听内容。我需要一个免费的可嵌入 Flash 的 mp3 播放器。有什么建议？因为
soundcloud - 事件不触发 html5 播放器
html5 player/api 更新了吗？事件 SC.Widget.Events.PLAY, SC.Widget.Events.PAUSE, SC.Widget.Events.FINISH， htm
linux - 自动打开和关闭 vlc 播放器
我想在 Lubuntu VMware 中自动打开和关闭 vlc 播放器。我试过一个shell脚本代码，如: vlc rtmp://code sleep(5) exit 0 or vl
ios - 表格单元格横向模式下的 Youtube 播放器
我有一个只支持纵向模式的应用程序，它有一个表格，每个单元格包含一个标题和一个带有 YouTube 视频的 web View 。现在您将如何让 Youtube 播放器同时处于横向和纵向模式？
YouTube 播放器 API 直播内容
我正在尝试在我的应用程序中使用 YouTube 播放器 API，但我不知道如何确定视频是否为直播。如果有人知道如何获得视频的真实持续时间。更新: 我想出了一种方法来确定内容是否是实时的，我使用我的后
api - 创建自定义桌面 YouTube 播放器
我想创建一个能够播放 YouTube 视频的音频并将下载的内容保存在本地缓存中的应用程序，因此当用户决定恢复或再次播放视频时，它不必再次下载部分视频而只需下载剩余部分(用户可以决定如何处理缓存，以及如
jquery - 模态窗口中的 YouTube 播放器
我希望我的页面将 div 显示为模态，然后播放 YouTube 视频。我能够按预期播放视频(下面的代码)，但是当我在过滤操作时切换到隐藏的 div 时，页面加载时隐藏的 div 不会将 data-sr
javascript - 部分内容无法识别 Angular 播放器
我正在尝试使用 AngularJS 和 WP API 构建 SPA。我使用部分在 ng-view 中加载我需要通过路由显示的所有内容。在此基础上，我添加了 Plangular，它是一个使用 Sound
javascript - 音频未在移动浏览器上加载(Plyr 播放器)
我找到了一个不错的 HTML 5 音频播放器，它带有基于 plyr 的播放列表和艺术品。它在我的桌面浏览器上运行良好，但在我的移动设备 (iOS) 上，按播放后无法播放。有一个codepen来演示:
python - Pyglet，播放器，下一首歌
我正在尝试通过pyglet在Python 3中播放歌曲。我可以播放和停止播放一首歌曲，但是当我尝试播放下一首歌曲时会产生错误。 I followed these instructions.我将在tki
javascript - 完成后重置 Vimeo 播放器
如何将嵌入的 Vimeo 视频重置为播放完毕后的加载状态？ Vimeo API 提供了卸载方法 player.api("unload") 但它不适用于非 Flash 播放器。最佳答案使用Vimeo
javascript - PhoneGap HTML5 播放器
我有一个用于音频录制和播放的网络应用程序。为此，我正在使用 html5 播放器。现在我必须开发 Phonegap Android 应用程序。我已将插件(org.apache.cordova.medi
javascript - 将字幕加载到 Netflix 播放器
有人知道如何像 SuperFlix 一样将自己的字幕加载到 Netflix 播放器吗？关于 Netflix HTML5 播放器的信息很少，其中之一是我应该可以使用操作播放器 netflix.cadm
youtube - 嵌入新的黑色 YouTube 播放器
如何将新的黑色 YouTube 播放器嵌入到我的网站(刚刚推出的网站)中？我以前曾问过这个问题，但它已关闭，因为在投票否决和关闭之前没有人愿意真正阅读该问题。不，我没有问如何嵌入V2或V3播放器，我
java - Mp3 播放器 JavaFX
几个小时以来，我一直在尝试添加一种打开我的 mp3 文件的方法并在队列中一一打开它们。但我不知道该怎么做。当涉及到单个文件时，我打开并播放不是问题。所以我正在考虑 Media(JavaFX) 类中的线
jwplayer - JW 播放器 "setFullscreen"
我知道这个函数 (setFullscreen) 只适用于 HTML5，但它对我不起作用。这是我使用的方式: setFullscreen: true 我希望 JW Player 在页面加载后立即以全屏模

首页

博学

6Ren·AI

商城

python - feedparser 无法获取 youtube 播放器