Python爬取12306车次信息代码详解-6ren

Python爬取12306车次信息代码详解

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python爬取12306车次信息代码详解由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

详情查看下面的代码:

如果被识别就要添加一个cookie如果没有被识别的话就要一个user—agent就好了。如果出现乱码就设置编码格式为utf-8 。

 
    ? 
   
         #静态的数据一般在elements中（复制文字到sources按ctrl+f搜索。找到的为静态），而动态去network中去寻找相关的信息 
        
         import 
         requests 
        
         import 
         re 
        
         def 
         send_request(): 
        
         headers  
         = 
         { 
         'user-agent' 
         : 
         'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36' 
        
         , 
         'Cookie' 
         : 
         '_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc' 
         } 
         #创建头部信息 
        
         url 
         = 
         'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT' 
        
         #设置编码格式。防止乱码 
        
         resp 
         = 
         requests.get(url,headers 
         = 
         headers) 
        
         resp.encoding 
         = 
         'utf-8' 
        
         return 
         resp 
        
         #解析数据 
        
         #{}是字典。根据key获取值。 
        
         def 
         parse_json(resp,city): 
        
         json_ticket 
         = 
         resp.json() 
         #将相应的数据转换为json 
        
         data_list 
         = 
         json_ticket[ 
         'data' 
         ][ 
         'result' 
         ] 
         #得到车次的列表 
        
         lst 
         = 
         [] 
         #列表 
        
         for 
         item  
         in 
         data_list: 
        
         #遍历车次信息进行分割 
        
         d 
         = 
         item.split( 
         '|' 
         ) 
        
         lst.append([d[ 
         3 
         ],city[d[ 
         6 
         ]],city[d[ 
         7 
         ]],d[ 
         31 
         ],d[ 
         30 
         ],d[ 
         13 
         ]]) 
        
         return 
         lst 
        
         ''' 
        
         d[3]从列表中获取索引为3的表示车次 
        
         d[6]查询起始站 
        
         d[7]查询到达站 
        
         d[31]一等座 
        
         d[30]表示二等座 
        
         d[13]表示出行时间''' 
        
         #获得station_name的信息 
        
         def 
         get_city(): 
        
         url 
         = 
         'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151' 
        
         headers  
         = 
         { 
         'user-agent' 
         :  
         'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36' 
         } 
        
         resp 
         = 
         requests.get(url,headers 
         = 
         headers) 
        
         resp.encoding 
         = 
         'utf-8' 
        
         #进行数据的提取(只要一部分) 
        
         stations 
         = 
         re.findall( 
         '([\u4e00-\u9fa5]+)\|([A-Z]+)' 
         ,resp.text) 
        
         #将列表进行转换为字典 
        
         stations_data 
         = 
         dict 
         (stations) 
        
         #key与value进行互换 
        
         station_d 
         = 
         {} 
         #空字典。用于完成上述操作 
        
         for 
         item  
         in 
         stations_data: 
        
         station_d[stations_data[item]] 
         = 
         item 
        
         #print(station_d) 
        
         return 
         station_d 
        
         def 
         start(): 
        
         lst 
         = 
         parse_json(send_request(),get_city()) 
        
         #进行数据的筛选(得到有效的数据) 
        
         for 
         i  
         in 
         lst: 
        
         if 
         i[ 
         3 
         ]! 
         = 
         '无' 
         and 
         i[ 
         3 
         ]! 
         = 
         '': 
        
         print 
         (i) 
        
         if 
         __name__ 
         = 
         = 
         '__main__' 
         : 
        
         start()  
         #开始

运行的截图:

Python爬取12306车次信息代码详解

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：https://www.cnblogs.com/dazhi151/p/13412089.html 。

最后此篇关于Python爬取12306车次信息代码详解的文章就讲到这里了,如果你想了解更多关于Python爬取12306车次信息代码详解的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： Python下载网易云歌单歌曲的示例代码

文章推荐： Django中数据库的数据关系:一对一,一对多,多对多

文章推荐： Python读取xlsx数据生成图标代码实例

文章推荐： python高效过滤出文件夹下指定文件名结尾的文件实例

Android MediaPlayer 信息/警告 (703, 0) 信息/警告 (701, 0) 慢速 wifi 或数据连接
03-25 05:52:15.329 8029-8042/com.mgh.radio W/MediaPlayerNative: info/warning (703, 0) 03-25 05:52:15
c# - FrameworkElementFactory 信息
我一直在 Internet 上到处寻找关于 FrameworkElementFactory 类的适当文档，但我似乎找不到有关它的适当教程或有用信息。请问对这个问题了解更多的人可以给我更多的信息吗？这
c - 如何在线程之间发送变量/信息
我需要知道一个线程在进入等待状态之前如何将其ID发送到另一个线程。我想传递一个带有其ID的变量，但我不知道该怎么做。最佳答案如果只有一个线程及其父线程，则可以使用全局变量，因为它们在所有线程之间共
rust - 如何阅读打印品前的文字!信息？
我正在尝试制作一个程序，该程序可以读取命令行上的所有单词，然后将其打印在新行上，而我想要做的是这样的: Some text: hello 但是相反，我得到了这样的东西: Some text: Hell
rabbitmq - 如何获取有关rabbitmq连接操作的详细日志/信息？
我有一个连接到rabbitmq服务器的python程序。当该程序启动时，它连接良好。但是当rabbitmq服务器重新启动时，我的程序无法重新连接到它，并留下错误“Socket已关闭”(由kombu产生
kubernetes - 如何在CD输出中包含Pod启动日志/信息？
我正在设置CI / CD管道。部署步骤运行以下命令: kubectl apply -f manifest.yml --namespace kubectl rollout status Deploym
java - 如何在java中使用ews从电子邮件中获取 "To"信息
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
SVN 信息 - 我上次更改的日期在我的文本上次更新日期之前
这是我在文件上运行 svn info 时输出的一部分: Last Changed Author: [user] Last Changed Rev: 269612 Last Changed Date:
java - android制作一个音乐应用程序访问sd卡以获取音乐数据帮助/信息
所以我正在构建这个音乐应用程序，到目前为止它只扫描 SD 卡内的特定文件夹。这将返回路径，然后播放它们。几个小时前我得知android系统中有一个媒体文件数据库所以我想知道这个媒体文件数据库是否存
python - 如何在树状图上添加%信息？
我正在绘制树形图，并且想知道如何绘制树类的相对百分比，即 A组=100 B地=30 C地=50 D 地 =20 然后，在图中，应该添加: A 组“50%” B 组“15%” 等在其“Group X”标
php - 如何在用户首次登录时显示教程/信息？
我正在构建一个社交网站，我想知道如何在用户首次登录时显示交互式教程和信息。比如只有在第一次登录时，用户才会被要求在他们的个人资料中填写更多信息。我怎样才能通过 php 和 mysql 实现这一点？例子
java servlet 信息
我是 java servlet 的新手。我研究了一些关于 servlet 的代码，但我真的很想知道更多基本的东西以及它是如何工作的。我只是想知道什么类型的 Material /内容可以从 java s
mysql - 避免多个内部联接从同一个表添加新列(信息)
我想知道是否有办法为 user_id、sender_user_id 和 recipient_user_id 提供 name 信息来自 this fiddle 中的模式. 我现在唯一能想到的办法就是做这
c++ - 存储2人c++信息
这是我存储2个大学生信息的源代码。我想从输入中获取每个人的姓名、姓氏、ID 和 5 分，然后在输出中显示它们。我在输出中显示分数时遇到问题。请帮忙 #include using namespace
python - 从图像中提取统计数据/信息
假设我有一张带有条形图的图像，如下所示: 我想提取条形图和标签的值，除了训练 ML 模型之外，还有其他方法吗？我有一堆图像，我为其生成了图表和一些描述。我目前正尝试仅从我能够做到的描述中提取信息，但
iphone - GKTurnBasedParticipant 信息
有没有办法从 GKTurnBasedParticipant 对象中检索玩家的名字？似乎除了根据类引用的难看的 playerID 之外，没有办法显示有关游戏玩家的相关信息。还是我遗漏了什么？谢谢...
c# - KeyNotFoundException 信息
我有一个随机抛出“KeyNotFoundException”的 C# Silverlight 应用程序。我不知道找不到什么 key 。这让我想到了两个问题: KeyNotFoundException
iOS获取本地音频文件(属性/信息)
本文实例为大家分享了ios获取本地音频文件的具体代码，供大家参考，具体内容如下获取本地音频文件地址： ?
Sql查询MySql数据库中的表名和描述表中字段(列)信息
下面为大家介绍利用SQL查询语句获取Mysql数据库中表的表名，表描述、字段ID、字段名、数据类型、长度、精度、是否可以为null、默认值、是否自增、是否是主键、列描述 1、查询表信息（表名/表
c# - 是否有可能获得例如代码中的位置成员(member)信息？
问题有没有办法获取代码中使用属性的位置，或声明成员变量的位置？我不是在寻找解决此问题的方法，只是寻求一个简单的答案，无论这在技术上是否可行。一些背景信息我已经定义了一个属性，该属性使用提供给属

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python爬取12306车次信息代码详解