gpt4 book ai didi

javascript - XBMC(Python)问题的简单登录功能

转载 作者:太空宇宙 更新时间:2023-11-03 16:15:21 25 4
gpt4 key购买 nike

我正在尝试通过 python(xbmc/kodi) 抓取 Javascript 日历页面的各个部分。到目前为止,我已经能够抓取静态 html 变量,但不能抓取 JavaScript 生成的部分。

我试图检索的变量是 <strong class="item-title">**this**</strong> , <span class="item-daterange">**this**</span> and <div class="item-location">**this**</div> ,请注意,它们位于 html 源的不同部分,并通过 JavaScript 呈现。所有抓取的变量都应附加到一个字符串中并显示。

response = net.http_GET('my URL')
link = response.content
match=re.compile('<strong class="gcf-item-title">(.+?)</strong>').findall(link)
for name in match:
name = name
print name

从上面的正则表达式中,我可以只抓取其中一个变量,因为我需要一个字符串列表来显示所有变量,那么如何才能做到这一点?

我知道必须预先渲染页面才能抓取 javascript 变量,但是由于我使用的是 xbmc ,所以我不确定如何导入其他 python 库(例如 dryscrape)来完成此操作。下载 Dryscrape 为我提供了 setup.py 、 init.py 文件以及其他一些文件,但我如何才能将它们一起使用?

谢谢。

最佳答案

您的问题是关于抓取 JavaScript 的步骤、如何在 XBMC/Kodi 上使用 Python,或者如何安装 setup.py 文件附带的软件包?

仅根据上面的正则表达式,如果您的条目始终 <strong class="item-title">**this**</strong>您不会获得匹配项,因为您的 re 模式适用于 class="gcf-item-title 的 元素。

您正在使用或能够使用BeautifulSoup吗?如果您没有使用它,但可以使用它,那么您应该使用它——它在抓取网站方面会改变您的生活。

关于javascript - XBMC(Python)问题的简单登录功能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38983104/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com