gpt4 book ai didi

python - 如何获取CNN的主要头条新闻?

转载 作者:行者123 更新时间:2023-12-01 00:46:50 26 4
gpt4 key购买 nike

enter image description here

试图只捕获“大使称特朗普无能”,但我似乎无法登陆该地区。我尝试过拉动“h2”和类以及“强标签”,但似乎找不到任何东西。下面的代码我保持原样,它是我唯一可以显示的东西。

soup = BeautifulSoup(data.text,'html.parser')
for rows in soup.find_all('li'):
for x in soup.findChildren('div'):
print(x)

最佳答案

页面动态加载数据。如果您检查页面向哪些 URL 发出请求(例如在 Firefox 开发人员工具中),您会发现数据位于不同的 url 中。不幸的是,这个网址(https://edition.cnn.com/data/ocs/section/index.html:intl_homepage1-zone-1/views/zones/common/zone-manager.izl)是动态构造的:

import requests
from bs4 import BeautifulSoup

url = 'https://edition.cnn.com/data/ocs/section/index.html:intl_homepage1-zone-1/views/zones/common/zone-manager.izl'
soup = BeautifulSoup(requests.get(url).text, 'lxml')
print(soup.h2.text)

打印:

UK ambassador calls Trump 'inept' and 'insecure'

关于python - 如何获取CNN的主要头条新闻?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56920110/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com