gpt4 book ai didi

python-3.x - 如何使用python提取HTML文档的 'alt'值?

转载 作者:行者123 更新时间:2023-12-04 08:38:34 26 4
gpt4 key购买 nike

我正在学习 Beautifulsoup 的基本功能。我想知道下面哪一部分代码可以修复以提取电影排名页面上的 alt 数量(意味着排名列表的编号,如 1、2、3)。我在下面写了示例

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}

data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303')

soup = BeautifulSoup(data.text, 'html.parser')

movies = soup.select('#old_content > table > tbody > tr')
print(len(movies))

for movie in movies:
d_tag = movie.select_one('td.ac > alt')
if d_tag is not None:
print (d_tag)
我尝试了几种方法来发现以 'd_tag = ' 开头的在线答案
movie.select.one('td.ac > alt') (这项工作,但不仅仅是我需要的“数字”。)
movie.select.one('td.ac > img alt')
movie.select.one('td.ac > img > alt')
movie.select.one('td.ac > img.alt')
这是第一次在这个伟大的社区提出问题,如果我的问题很尴尬,请原谅。

最佳答案

要获取所有电影标题+排名,您可以使用以下示例:

import requests 
from bs4 import BeautifulSoup


url = 'https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303'
soup = BeautifulSoup( requests.get(url).content, 'html.parser' )

for row in soup.select('.list_ranking > tbody > tr:has(a)'):
movie_title = row.a.text
ranking = row.select_one('.point').text
print(movie_title, ranking)
打印:
그린 북 9.60
가버나움 9.59
베일리 어게인 9.52
주전장 9.52
포드 V 페라리 9.51
아일라 9.49
원더 9.49
당갈 9.47
쇼생크 탈출 9.44
터미네이터 2:오리지널 9.43
보헤미안 랩소디 9.42
덕구 9.41
나 홀로 집에 9.41
월-E 9.41
살인의 추억 9.40
빽 투 더 퓨쳐 9.40
인생은 아름다워 9.39
매트릭스 9.39
라이언 일병 구하기 9.39
사운드 오브 뮤직 9.39
헬프 9.39
포레스트 검프 9.39
안녕 베일리 9.39
글래디에이터 9.39
위대한 쇼맨 9.38
센과 치히로의 행방불명 9.38
토이 스토리 3 9.38
어벤져스: 엔드게임 9.38
클래식 9.38
알라딘 9.38
헌터 킬러 9.37
죽은 시인의 사회 9.37
아이 캔 스피크 9.37
레옹 9.37
동주 9.37
반지의 제왕: 왕의 귀환 9.37
타이타닉 9.36
캐스트 어웨이 9.36
여인의 향기 9.36
집으로... 9.36
굿바이 마이 프랜드 9.35
서유기 2 - 선리기연 9.35
주토피아 9.35
두 교황 9.35
굿 윌 헌팅 9.35
클레멘타인 9.35
히든 피겨스 9.35
세 얼간이 9.35
쉰들러 리스트 9.34
울지마 톤즈 9.34

关于python-3.x - 如何使用python提取HTML文档的 'alt'值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64677396/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com