gpt4 book ai didi

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 37 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

简介 。

有些 post 的请求参数是 json 格式的,这个前面发送post 请求里面提到过,需要导入 json模块处理。现在企业公司一般常见的接口因为json数据容易处理,所以绝大多数返回数据也是 json 格式的,我们在做判断时候,往往只需要提取其中 。

几个关键的参数就行,这时候我们就需要 json 来解析返回的数据了。首先来说一下笔者为何要单独写这么一篇,原因是:python 里面 bool 值是 true 和 false,json 里面 bool 值是 true和 false,并且区分大小写,这就尴尬了,明明都是 bool 值.

在python里面写的代码,传到json里,不用说肯定识别不了,所以需要把python的代码经过encode后成为 json 可识别的数据类型,反之json数据就需要decode后成为python代码可识别的数据类型。这个也是需要初学者注意,也算是个细微差和 。

一个坑人的地方吧,如果不注意很容易掉坑里啊。笔者就掉进去过,还好自救能力强,爬出来了,所以为了警醒后来者,就有了这篇随笔.

json 模块简介 。

1、json 简介:json,全名 javascript object notation,json(javascript object notation(记号、标记))是一种轻量级的数据交换格式。它基于javascript(standard ecma-262 3rd edition - december 1999)的一个子集。json采用完全独立 。

于语言的文本格式,但是也使用了类似于c语言家族的习惯(包括c, c++, c#, java, javascript, perl, python等)。这些特性使json成为理想的数据交换语言。json易于人阅读和编写,同时也易于机器解析和生成。常用于 http 请求中,接口 。

返回的数据中.

2、可以用 help(json),查看对应的源码注释内容 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

编码encode(python->json) 。

1、为什么要 encode,笔者在开头就给各位小伙伴开门见山的说出来了,让各位带着问题来探索、来学习、来思考 。

2、举个简单例子,下图的实例中 dict 类型经过 json.dumps()后变成 str,true 变成了 true,false变成了 fasle 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

3、从json模块的对应源码中可以查看到,python 数据转化成 json可识别的数据,对应的表关系如下 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

解码 decode(json->python) 。

1、以博客园的登录成功结果:{"success":true}为例,我们其实最想知道的是 success 这个字段返回的是 true 还是 false,以便于我们对接口进行断言,以下是fiddler抓包博客园登录成功的结果 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

2、如果以 content 字节输出,返回的是一个字符串:{"success":true},这样获取后面那个结果就不方便了,导致断言也不方便 。

3、如果经过 json 解码后,返回的就是一个字典:{u'success': true},这样获取后面那个结果,就用字典的方式去取值:result2["success"],这样不言而喻断言也就简单方便了 。

4、由于博客园的登录机制的改变,我们这里接着上一篇的删除随笔的返回结果,给小伙伴们实战演练一下 。

5、用fiddler抓包,抓到删除新建随笔的请求,从抓包结果可以看出,返回结果是一个字符串:{"issuccess":true},按照上边的步骤用代码实现 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

6、代码及结果(看到了吧,就是这么轻松被我们取到其value了,接下来就可以进行断言了) 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

7、从json模块的对应源码中可以查看到, json 数据转化成 python 可识别的数据,对应的表关系如下 。

python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)

8、参考代码 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
# coding:utf-8
import requests
# 先打开登录首页,获取部分cookie
url = "https://passport.cnblogs.com/user/signin"
headers = {
       "user-agent" : "mozilla/5.0 (windows nt 10.0; wow64; rv:44.0) gecko/20100101 firefox/44.0"
       } # get方法其它加个ser-agent就可以了
s = requests.session()
r = s.get(url, headers = headers,verify = false)
print (s.cookies)
# 添加登录需要的两个cookie
c = requests.cookies.requestscookiejar()
c. set ( '.cnblogscookie' , 'xxx' ) # 填上面抓包内容
c. set ( '.cnblogs.aspnetcore.cookies' , 'xxx' ) # 填上面抓包内容
c. set ( 'alwayscreateitemsasactive' , "true" )
c. set ( 'admincookiealwaysexpandadvanced' , "true" )
s.cookies.update(c)
print (s.cookies)
result = r.content
print (result.decode( 'utf-8' ))
# 登录成功后保存编辑内容
url2 = "https://i.cnblogs.com/editposts.aspx?opt=1"
body = { "__viewstate" : "",
     "__viewstategenerator" : "fe27d343" ,
     "editor$edit$txbtitle" : "这是绕过登录的标题:北京-宏哥" ,
     "editor$edit$editorbody" : "<p>这里是中文内容:http://www.cnblogs.com/duhong/</p>" ,
     "editor$edit$advanced$ckbpublished" : "on" ,
     "editor$edit$advanced$chkdisplayhomepage" : "on" ,
     "editor$edit$advanced$chkcomments" : "on" ,
     "editor$edit$advanced$chkmainsyndication" : "on" ,
     "editor$edit$lkbdraft" : "存为草稿" ,
      }
r2 = s.post(url2, data = body, verify = false)
print (r.content.decode( 'utf-8' ))
 
# 第三步:正则提取需要的参数值
import re
postid = re.findall(r "postid=(.+?)&" , r2.url)
print ( type (postid))
print (postid) # 这里是 list
# 提取为字符串
print (postid[ 0 ])
# 第四步:删除草稿箱
url3 = "https://i.cnblogs.com/post/delete"
json3 = { "postid" : postid[ 0 ]}
r3 = s.post(url3, json = json3, verify = false)
result = r3.content #content数据是字节输出
print ( type (result))
print (result)
#json是经过加码encode成对应python的数据类型
result1 = r3.json()
print ( type (result1))
print (result1[ 'issuccess' ])

小结 。

在实际工作中遇到问题要学会查资料,看其对应的官方文档以及源码,不仅可以起到事半功倍的作用,也可以锻炼自己解决问题的能力。这一点笔者深有体会!!! 。

以上所述是小编给大家介绍的python json 数据处理详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我网站的支持! 。

原文链接:https://www.cnblogs.com/du-hong/p/10688197.html 。

最后此篇关于python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)的文章就讲到这里了,如果你想了解更多关于python接口自动化(十七)--Json 数据处理---一次爬坑记(详解)的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com