gpt4 book ai didi

盘点Python中四种读取Json文件和提取Json文件内容的方法

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 24 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章盘点Python中四种读取Json文件和提取Json文件内容的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

盘点Python中四种读取Json文件和提取Json文件内容的方法

大家好,我是Python进阶者.

前言

前几天在才哥的交流群有个叫【杭州-学生-飞飞飞】的粉丝在群里问了一个json文件处理的问题.

盘点Python中四种读取Json文件和提取Json文件内容的方法

看上去他只需要follower和ddate这两个字段下的对应的值.

盘点Python中四种读取Json文件和提取Json文件内容的方法

我们知道json是一种常见的数据传输形式,所以对于爬取数据的数据解析,json的相关操作是比较重要的,能够加快我们的数据提取效率.

思路

关于这个问题,倒不是很难,群里提出了三个方法,第一个是才哥说的pd处理或者正则表达式,第二个是小编自己提出的json处理,第三个是【成都-IT技术支持-小王】提出的jsonpath,总之方法很多,这里给出4个处理方法,希望下次粉丝们再遇到类似问题的时候,有章可循.

实现过程

1、正则表达式

这个方法可以看看,通过匹配的方法进行提取,代码如下所示:

  1. import re
  2. import json
  3.  
  4. file = open('漫画.txt', 'r', encoding='utf-8')
  5. content = file.readline()
  6. ddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content)
  7. ddate_result2 = re.findall('"ddate":"(.*?)"', content)
  8. follower_result1 = re.findall('"follower":(\d+),"', content)
  9.  
  10. print(ddate_result1)
  11. print(ddate_result2)
  12. print(follower_result1)

运行之后,可以得到结果:

盘点Python中四种读取Json文件和提取Json文件内容的方法

关于ddate,follower获取的方法肯定还有很多其他写法,这里只是抛砖引玉,欢迎大家多多尝试.

2、jsonpath方法一

关于jsonpath的用法,之前在这篇文章中有提及,感兴趣的小伙伴也可以去看看:数据提取之JSON与JsonPATH.

下面是【成都-IT技术支持-小王】大佬给的代码:

  1. from jsonpath import jsonpath
  2. import json
  3.  
  4. """follower和ddate"""
  5. with open("漫画.txt", encoding="utf-8") as file:
  6. file_json = json.loads(file.readline())
  7.  
  8. follower = jsonpath(file_json, "$..follower")
  9. ddate = jsonpath(file_json, "$..ddate")
  10. print(follower)
  11. print(ddate)

代码运行之后,就会得到想要的数据,如下图所示:

盘点Python中四种读取Json文件和提取Json文件内容的方法

这个..就和xpath里面的//一样,子孙节点,$是根节点.

3、jsonpath方法二

这个是另外一个用法了,小号【皮皮】提供的,直接上代码.

  1. import json
  2. import jsonpath
  3.  
  4.  
  5. # obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件的形式,不能直接放一个文件名的字符串
  6. file = open('漫画.txt', 'r', encoding='utf-8') # 注意,这里是文件的形式,不能直接放一个文件名的字符串
  7. obj = json.loads(file.readline())
  8. follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
  11. print(follower)
  12. print(ddate)

代码运行之后,也可以得到预期的结果.

盘点Python中四种读取Json文件和提取Json文件内容的方法

当然了,如果你的文件本来就是json文件,也可以直接读取,代码类似:

  1. import json
  2. import jsonpath
  3.  
  4.  
  5. obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件的形式,不能直接放一个文件名的字符串
  6. # file = open('罗翔.json', 'r', encoding='utf-8') # 注意,这里是文件的形式,不能直接放一个文件名的字符串
  7. # obj = json.loads(file.readline())
  8. follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
  11. print(follower)
  12. print(ddate)

运行之后,也可以得到预期的结果:

盘点Python中四种读取Json文件和提取Json文件内容的方法

4、jsonpath方法三

这个是群里【深圳-Hua Bro】华博提供的,代码如下:

  1. import json
  2. import jsonpath
  3.  
  4. with open("罗翔.txt", 'r', encoding="UTF-8") as fr:
  5. file_json = eval(fr.read().replace('\n', '')) # 读取的str转为字典
  6. follower = jsonpath.jsonpath(file_json, '$..follower') # 文件对象 jsonpath语法
  7. ddate = jsonpath.jsonpath(file_json, '$..ddate') # 文件对象 jsonpath语法
  8. print(follower)
  9. print(ddate)

方法大同小异,运行之后,也可以拿到预取的目标数据,如下图所示.

盘点Python中四种读取Json文件和提取Json文件内容的方法

总结

我是Python进阶者。本文基于粉丝针对json文件处理的提问,综合群友们的回答,整理了4种可行的方案,帮助粉丝解决了问题。这里墙裂给大家推荐jsonpath这个库,感兴趣的小伙伴可以学习学习,下次再遇到json文件提取数据就再也不慌啦.

原文链接:https://mp.weixin.qq.com/s/H9StP63y3eIAuyaFo1JTeA 。

最后此篇关于盘点Python中四种读取Json文件和提取Json文件内容的方法的文章就讲到这里了,如果你想了解更多关于盘点Python中四种读取Json文件和提取Json文件内容的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com