gpt4 book ai didi

教你用Python爬取英雄联盟皮肤原画

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 27 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章教你用Python爬取英雄联盟皮肤原画由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

1、推理原理

1.先去《英雄联盟》官网找到英雄及皮肤图片的网址:

http://lol.qq.com/data/info-heros.shtml 。

教你用Python爬取英雄联盟皮肤原画

2.从上面网址可以看到所有英雄都在,按下f12查看源代码,发现英雄及皮肤图片并没有直接给出,而是隐藏在js文件中。这时候需要点开network,找到js窗口,刷我页,就看到一个champion.js的选项,点击可以看到一个字典——里面就包含了所有英雄的名字(英文)以及对应的编号.

教你用Python爬取英雄联盟皮肤原画

3.但是只有英雄的名字(英文)以及对应的编号并不能找到图片地址,于是回到网页,随便点开一个英雄,跳转页面后发现英雄及皮肤的图片都在,但要下载还需要找到原地址,这是鼠标右击选择“在新标签页中打开”,新的网页才是图片的原地址.

教你用Python爬取英雄联盟皮肤原画

4.图中红色框就是我们需要的图片地址,经过分析知道:每一个英雄及皮肤的地址只有编号不一样(),而该编号有6位,前3位表示英雄,后三位表示皮肤。刚才找到的js文件中恰好有英雄的编号,而皮肤的编码可以自己定义,反正每个英雄皮肤不超过20个,然后组合起来就可以了.

教你用Python爬取英雄联盟皮肤原画

2、推理代码

第一步:获取js字典 。

?
1
2
3
4
5
6
7
8
def path_js(url_js):
     res_js = requests.get(url_js, verify = false).content
     html_js = res_js.decode( "gbk" )
     pat_js = r '"keys":(.*?),"data"'
     enc = re. compile (pat_js)
     list_js = enc.findall(html_js)
     dict_js = eval (list_js[ 0 ])
     return dict_js

第二步:从 js字典中提取到key值生成url列表 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
def path_url(dict_js):
     pic_list = []
     for key in dict_js:
         for i in range ( 20 ):
             xuhao = str (i)
             if len (xuhao) = = 1 :
                 num_houxu = "00" + xuhao
             elif len (xuhao) = = 2 :
                 num_houxu = "0" + xuhao
             numstr = key + num_houxu
             url = r 'http://ossweb-img.qq.com/images/lol/web201310/skin/big' + numstr + '.jpg'
             pic_list.append(url)
     print (pic_list)
     return pic_list

第三步:从 js字典中提取到value值生成name列表 。

?
1
2
3
4
5
6
7
def name_pic(dict_js, path):
     list_filepath = []
     for name in dict_js.values():
         for i in range ( 20 ):
             file_path = path + name + str (i) + '.jpg'
             list_filepath.append(file_path)
     return list_filepath

教你用Python爬取英雄联盟皮肤原画

第四步:下载并保存数据 。

?
1
2
3
4
5
6
7
8
9
10
def writing(url_list, list_filepath):
     try :
         for i in range ( len (url_list)):
             res = requests.get(url_list[i], verify = false).content
             with open (list_filepath[i], "wb" ) as f:
                 f.write(res)
 
     except exception as e:
         print ( "下载图片出错,%s" % (e))
         return false

第五步:执行主程序 。

?
1
2
3
4
5
6
7
if __name__ = = '__main__' :
     url_js = r 'http://lol.qq.com/biz/hero/champion.js'
     path = r './data/'   #图片存在的文件夹
     dict_js = path_js(url_js)
     url_list = path_url(dict_js)
     list_filepath = name_pic(dict_js, path)
     writing(url_list, list_filepath)

运行后会在控制台打印出每一张图片的网址:

教你用Python爬取英雄联盟皮肤原画

在文件夹中可以看到图片已经下载好 如图:

教你用Python爬取英雄联盟皮肤原画

到此这篇关于教你用python爬取英雄联盟皮肤原画的文章就介绍到这了,更多相关python爬取皮肤内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。

原文链接:https://blog.csdn.net/yunyun889901/article/details/117778191 。

最后此篇关于教你用Python爬取英雄联盟皮肤原画的文章就讲到这里了,如果你想了解更多关于教你用Python爬取英雄联盟皮肤原画的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com