- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我无法在属于 slider /轮播的网站上抓取数据。当我运行我的脚本时,它只从 slider /旋转木马中抓取第一个项目。它不会遍历该轮播中的所有页面。
我要抓取的网站是:
我的 Python 脚本:
soup = BeautifulSoup(response, 'html.parser')
divTag = soup.find_all("a", class_=['sc-VigVT', 'eJWBx'])
for tag in divTag:
tdTags = tag.find_all("h3", class_=['sc-jAaTju', 'iNsSAY'])
for tag in tdTags:
print(tag.text)
输出:
Kunal Bahl and Rohit Bansal reveal the inside story of the Snapdeal turnaround
有 7 个轮播项目,但我只能获得第一个。我无法从轮播/ slider 中的第 2 - 7 页获取数据。
请检查下图我指的是什么(红色圆圈):
最佳答案
轮播是使用在 JS 中硬编码的 JSON 数据从 Javascript 生成的。准确地说,此 JSON 是通过以下方式引入的:
window.__REDUX_STATE__= { ..... }
所以大概仅供引用,该站点使用 redux管理应用程序的状态
我们可以使用以下脚本提取此 JSON:
import requests
from bs4 import BeautifulSoup
import json
import pprint
r = requests.get('https://yourstory.com/')
prefix = "window.__REDUX_STATE__="
soup = BeautifulSoup(r.content, "html.parser")
#get the redux state (json)
data = [
json.loads(t.text[len(prefix):])
for t in soup.find_all('script')
if "__REDUX_STATE__" in t.text
]
#get only the section with cardType == "CarouselCard"
carouselCards = [
t["data"]
for t in data[0]["home"]["sections"]
if ("cardType" in t) and (t["cardType"] == "CarouselCard")
][0]
#print all cards
pprint.pprint(carouselCards)
#get the name, image path & link path
print([
(t["title"], t["path"], t["metadata"]["thumbnail"])
for t in carouselCards
])
JSON 在 home
字段中有一个 sections
数组。此部分对象包括一些具有 cardType
和值 CarouselCard
的对象,其中有您要查找的数据
另外,从 JSON 来看,Carousel 部分是这样开始的:
{
"type":"content",
"dataAPI":"/api/v2/featured_stories?brand=yourstory&key=CURATED_SET",
"dataAttribute":"featured",
"cardType":"CarouselCard",
"data":[]
}
所以我想您也可以使用 API 获取卡片:https://yourstory.com/api/v2/featured_stories?brand=yourstory&key=CURATED_SET
import requests
r = requests.get('https://yourstory.com/api/v2/featured_stories?brand=yourstory&key=CURATED_SET')
#get the name, image path & link path
print([
(t["title"], t["path"], t["metadata"]["thumbnail"])
for t in r.json()["stories"]
])
哪个更直接
关于python - 无法抓取屏幕上不可见但属于 slider /轮播的一部分的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58633524/
我最近为我的一个 iPhone 应用程序上传了更新,现在该应用程序刚刚准备好销售,但我只更新 iPhone 6 的屏幕截图,而不更新其他屏幕截图。现在我明白了,它们是新游戏的旧屏幕,这可能会让用户感到
我需要清除 Scala 中的控制台屏幕 我尝试过标准 ANSI Clear 屏幕,rosettacode.org 建议将其称为“终端控制/清除屏幕”here object Cls extends Ap
我需要清除 Scala 中的控制台屏幕 我尝试过标准 ANSI Clear 屏幕,rosettacode.org 建议将其称为“终端控制/清除屏幕”here object Cls extends Ap
我将从头开始,我正在开发一个跨越多个监视器的应用程序,每个监视器将包含一个 WPF 窗口,并且这些窗口使用一个 View 模型类进行控制。现在假设我在 200,300 (x,y) 处的所有窗口上都有一
谁能告诉我如何阻止矩形在我的游戏中离开面板(屏幕)?矩形随着击键并排移动。 最佳答案 这是你应该做的: 1. 跟踪矩形的 (x,y) 坐标。 2. 确保矩形的x + width 不大于JPanel 的
我正在尝试检测电源按钮是否在 4 秒内被按下 3 次。以下代码无效。 public class PowerButtonReceiver extends BroadcastReceiver{ s
我为我的新网上商店制作了一个横幅,但有一个问题。例如,当网站在我的笔记本电脑上显示为全尺寸时,横幅非常适合,但是当我在移动设备、笔记本电脑和较小尺寸的网站上看到该网站时,横幅就不合适了。我真的希望你们
我希望这个问题能够得到解决: 给定,屏幕 session 正在运行,并在终端中打开(附加)。 问题。 如果终端 session 终止,但未与屏幕 session 分离,则屏幕 session 中运行的
如何在点击通知时转到特定屏幕?我在 javascript 中使用了云功能,当我点击通知时,它打开了我的应用程序而不是特定的屏幕 _fcm.configure( onMessage: (Map m
Qt 确实支持像素比率 (devicePixelRatio),这在我的各种桌面上是不同的: ) 桌面 w1920 h1080 - 比例:1 ) 桌面 w3840 h2160 与 qputenv("QT
我一直在做一些研究,发现了这种情况。如果要写入STDOUT(屏幕),将无法执行多线程脚本,该脚本通过简单的单线程脚本可以更快地打印数据。但是,如果您写入这样的文件: myPrinter.perl >
我是 ABAP 的新手,我想制作一个具有多个屏幕和一个初始主屏幕的程序,可以在其中看到所有程序屏幕的列表。我知道我可以对它们进行硬编码,但应该有更好的方法。 如果有任何类型的字段/区域,我需要使此列表
我目前正在探索创建越狱调整。我想解锁手机屏幕。这是怎么做到的?在 iOS 7 上可以使用哪些私有(private) API 来实现这一点? 最佳答案 如果我们谈论越狱,那么您可以编写一个 Spring
我正在寻找一种方法来关闭 iPhone 屏幕而不让 iPhone 进入休眠状态。我真的不介意关闭屏幕是否违反苹果规则。将窗口 alpha 设置为 0 可以解决问题吗?我可以更改某种 boolean 值
我在 iTerm2 中使用 tmux。 当我在 bash 中时,使用 Ctrl-L 清除屏幕有效,但在我拖尾服务器日志时不起作用。我该如何解决? 最佳答案 您可以使用 send-keys -R 清除当
如何以编程方式锁定和解锁 iPhone 的主屏幕(即设备本身)? 最佳答案 这是不可能的。但是,您可以在应用程序运行时“阻止”手机锁定。 [UIApplication sharedApplicatio
我的任务是创建社交网络 我有一个主页,显示用户通过 Canvas 创建的所有绘图。用户可以在自己的绘图上绘图,并且可以添加也有权在其绘图上绘图的贡献者。问题是他们可以以某种方式同时绘制。 我想做的是,
退出后,如何从我在应用程序中打开的最后一个屏幕继续。 比如说我有屏幕A,B和C,并且在关闭应用程序之前我在屏幕B上。我的问题是当我再次打开应用程序时如何进入屏幕B。 最佳答案 当SharedPrefe
我试图停止一个进程,然后休眠10秒钟,杀死下一个进程再休眠10秒钟,然后启动另一个进程。问题是一切都立即运行。所以我想开始的过程没有运行,因为其他人都没有停止。 Start-Process Power
我正在尝试以 HW 身份进行测验。我输入的回复应该会出现在屏幕上,但事实并非如此。我使用函数response()多次检查了“15”行和“17”行中出了什么问题。我没有发现任何错误,需要调试和编写正确语
我是一名优秀的程序员,十分优秀!