gpt4 book ai didi

Python爬取12306车次信息代码详解

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 29 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python爬取12306车次信息代码详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

详情查看下面的代码:

如果被识别就要添加一个cookie如果没有被识别的话就要一个user—agent就好了。如果出现乱码就设置编码格式为utf-8 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
#静态的数据一般在elements中(复制文字到sources按ctrl+f搜索。找到的为静态),而动态去network中去寻找相关的信息
import requests
import re
def send_request():
   headers = { 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
         , 'Cookie' : '_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc' } #创建头部信息
   url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT'
   #设置编码格式。防止乱码
   resp = requests.get(url,headers = headers)
   resp.encoding = 'utf-8'
   return resp
 
#解析数据
#{}是字典。根据key获取值。
def parse_json(resp,city):
   json_ticket = resp.json() #将相应的数据转换为json
   data_list = json_ticket[ 'data' ][ 'result' ] #得到车次的列表
   lst = [] #列表
   for item in data_list:
     #遍历车次信息进行分割
     d = item.split( '|' )
     lst.append([d[ 3 ],city[d[ 6 ]],city[d[ 7 ]],d[ 31 ],d[ 30 ],d[ 13 ]])
   return lst
'''
d[3]从列表中获取索引为3的表示车次
d[6]查询起始站
d[7]查询到达站
d[31]一等座
d[30]表示二等座
d[13]表示出行时间'''
#获得station_name的信息
def get_city():
   url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151'
   headers = { 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36' }
   resp = requests.get(url,headers = headers)
   resp.encoding = 'utf-8'
   #进行数据的提取(只要一部分)
   stations = re.findall( '([\u4e00-\u9fa5]+)\|([A-Z]+)' ,resp.text)
   #将列表进行转换为字典
   stations_data = dict (stations)
   #key与value进行互换
   station_d = {} #空字典。用于完成上述操作
   for item in stations_data:
     station_d[stations_data[item]] = item
   #print(station_d)
   return station_d
 
def start():
   lst = parse_json(send_request(),get_city())
   #进行数据的筛选(得到有效的数据)
   for i in lst:
     if i[ 3 ]! = '无' and i[ 3 ]! = '':
       print (i)
if __name__ = = '__main__' :
   start() #开始

运行的截图:

Python爬取12306车次信息代码详解

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.

原文链接:https://www.cnblogs.com/dazhi151/p/13412089.html 。

最后此篇关于Python爬取12306车次信息代码详解的文章就讲到这里了,如果你想了解更多关于Python爬取12306车次信息代码详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com