盘点Python中四种读取Json文件和提取Json文件内容的方法-6ren

盘点Python中四种读取Json文件和提取Json文件内容的方法

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

24

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章盘点Python中四种读取Json文件和提取Json文件内容的方法由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

盘点Python中四种读取Json文件和提取Json文件内容的方法

大家好，我是Python进阶者.

前言

前几天在才哥的交流群有个叫【杭州-学生-飞飞飞】的粉丝在群里问了一个json文件处理的问题.

盘点Python中四种读取Json文件和提取Json文件内容的方法

看上去他只需要follower和ddate这两个字段下的对应的值.

盘点Python中四种读取Json文件和提取Json文件内容的方法

我们知道json是一种常见的数据传输形式，所以对于爬取数据的数据解析，json的相关操作是比较重要的，能够加快我们的数据提取效率.

思路

关于这个问题，倒不是很难，群里提出了三个方法，第一个是才哥说的pd处理或者正则表达式，第二个是小编自己提出的json处理，第三个是【成都-IT技术支持-小王】提出的jsonpath，总之方法很多，这里给出4个处理方法，希望下次粉丝们再遇到类似问题的时候，有章可循.

实现过程

1、正则表达式

这个方法可以看看，通过匹配的方法进行提取，代码如下所示:

import re
import json
file = open('漫画.txt', 'r', encoding='utf-8')
content = file.readline()
ddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content)
ddate_result2 = re.findall('"ddate":"(.*?)"', content)
follower_result1 = re.findall('"follower":(\d+),"', content)
print(ddate_result1)
print(ddate_result2)
print(follower_result1)

运行之后，可以得到结果:

盘点Python中四种读取Json文件和提取Json文件内容的方法

关于ddate，follower获取的方法肯定还有很多其他写法，这里只是抛砖引玉，欢迎大家多多尝试.

2、jsonpath方法一

关于jsonpath的用法，之前在这篇文章中有提及，感兴趣的小伙伴也可以去看看：数据提取之JSON与JsonPATH.

下面是【成都-IT技术支持-小王】大佬给的代码:

from jsonpath import jsonpath
import json
"""follower和ddate"""
with open("漫画.txt", encoding="utf-8") as file:
file_json = json.loads(file.readline())
follower = jsonpath(file_json, "$..follower")
ddate = jsonpath(file_json, "$..ddate")
print(follower)
print(ddate)

代码运行之后，就会得到想要的数据，如下图所示:

盘点Python中四种读取Json文件和提取Json文件内容的方法

这个..就和xpath里面的//一样，子孙节点，$是根节点.

3、jsonpath方法二

这个是另外一个用法了，小号【皮皮】提供的，直接上代码.

import json
import jsonpath
# obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意，这里是文件的形式，不能直接放一个文件名的字符串
file = open('漫画.txt', 'r', encoding='utf-8') # 注意，这里是文件的形式，不能直接放一个文件名的字符串
obj = json.loads(file.readline())
follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法
ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

代码运行之后，也可以得到预期的结果.

盘点Python中四种读取Json文件和提取Json文件内容的方法

当然了，如果你的文件本来就是json文件，也可以直接读取，代码类似:

import json
import jsonpath
obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意，这里是文件的形式，不能直接放一个文件名的字符串
# file = open('罗翔.json', 'r', encoding='utf-8') # 注意，这里是文件的形式，不能直接放一个文件名的字符串
# obj = json.loads(file.readline())
follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法
ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

运行之后，也可以得到预期的结果:

盘点Python中四种读取Json文件和提取Json文件内容的方法

4、jsonpath方法三

这个是群里【深圳-Hua Bro】华博提供的，代码如下:

import json
import jsonpath
with open("罗翔.txt", 'r', encoding="UTF-8") as fr:
file_json = eval(fr.read().replace('\n', '')) # 读取的str转为字典
follower = jsonpath.jsonpath(file_json, '$..follower') # 文件对象 jsonpath语法
ddate = jsonpath.jsonpath(file_json, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

方法大同小异，运行之后，也可以拿到预取的目标数据，如下图所示.

盘点Python中四种读取Json文件和提取Json文件内容的方法

总结

我是Python进阶者。本文基于粉丝针对json文件处理的提问，综合群友们的回答，整理了4种可行的方案，帮助粉丝解决了问题。这里墙裂给大家推荐jsonpath这个库，感兴趣的小伙伴可以学习学习，下次再遇到json文件提取数据就再也不慌啦.

原文链接：https://mp.weixin.qq.com/s/H9StP63y3eIAuyaFo1JTeA 。

最后此篇关于盘点Python中四种读取Json文件和提取Json文件内容的方法的文章就讲到这里了,如果你想了解更多关于盘点Python中四种读取Json文件和提取Json文件内容的方法的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

24

4

0

文章推荐： C++实现学生管理系统

文章推荐： C++扑克牌的洗牌发牌游戏设计

文章推荐： C语言实现一个简易通讯录

文章推荐：选择 Go API 框架时要考虑的四件事

json - mongoexport - JSON 查询问题(扩展 JSON - JSON 输入无效)
最近开始学习MongoDB。今天老师教了我们 mongoexport 命令。在练习时，我遇到了一个典型的问题，包括教练在内的其他同学都没有遇到过。我在我的 Windows 10 机器上使用 Mongo
json - 如何将 JSON Schema 链接到我的 JSON 以验证 JSON？
我是 JSON Schema 的新手，读过什么是 JSON Schema 等等。但我不知道如何将 JSON Schema 链接到 JSON 以针对该 JSON Schema 进行验证。谁能解释一下？
json - 仅使用 json 在另一个 json 文件中包含一个 json 文件
在 xml 中，我可以在另一个 xml 文件中包含一个文件并使用它。如果您的软件从 xml 获取配置文件但没有任何方法来分离配置，如 apache/ngnix(nginx.conf - site-av
json - 如何反序列化包含具有更多 JSON 的字符串的 JSON？
我有一个 JSON 对象，其中包含一个本身是 JSON 对象的字符串。我如何反序列化它？我希望能够做类似的事情: #[derive(Deserialize)] struct B { c: S
json - Play Json 读取嵌套泛型序列化 Json
考虑以下 JSON { "a": "{\"b\": 12, \"c\": \"test\"}" } 我想定义一个泛型读取 Reads[Outer[T]]对于这种序列化的 Json import
json - 从 JSON 模式生成示例 JSON
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 11 个月前关闭。 Improve
json - DynamoDB JSON 还是标准 JSON？
我的旧项目在 MySQL 中有 Standard JSON 格式的数据。对于我在 JS (Node.js) 和 DynamoDB 中的全新项目，关于 Standard JSON格式: 是否建议将其转
json - JSON 值是有效的 JSON 吗？
JSON 值字符串、数字、true、false、null 是否是有效的 JSON？即，是 true 一个有效的 JSON 文档？还是必须是数组/对象？一些验证器接受这个(例如 http://jso
json - 如何编码嵌入在 JSON 中的 JSON
我有一个 JSON 字符串，其中一个字段是文本字段。这个文本字段可以包含用户在 UI 中输入的文本，如果他们输入的文本是 JSON 文本，也许是为了说明一些编码，我需要对他们的文本进行编码，以便它不会
json - 使用加号序列化 JSON 会导致无效的 JSON
我正在通过 IBM MQ 调用处理数据，当由 ColdFusion 10 (10,0,11,285437) 序列化时，0 将作为 +0.0 返回，它会导致无效的 JSON并且无法反序列化。 stPol
json - 在 json 中没有嵌套数组的情况下哈希到 json
我正在从三个数组中生成一个散列，然后尝试构建一个 json。我通过 json object has array 成功了。 require 'json' A = [['A1', 'A2', 'A3'],
json - 根据 JSON 中的字段有条件地解码 JSON
我从 API 接收 JSON，响应可以是 30 种类型之一。每种类型都有一组唯一的字段，但所有响应都有一个字段 type 说明它是哪种类型。我的方法是使用serde .我为每种响应类型创建一个结构并
json - 为什么我下载的 JSON 文件不再是 JSON？
我正在下载一个 JSON 文件，我已将其检查为带有“https://jsonlint.com”的有效 JSON 到文档目录。然后我打开文件并再次检查，结果显示为无效的 JSON。这怎么可能？？？？这是
json - 尝试解析 JSON 并创建提取的 JSON
我正在尝试根据从 API 接收到的数据动态创建一个 JSON 对象。收到的示例数据:将数据解码到下面给出的 CiItems 结构中 { "class_name": "test", "
json - 从 JSON 字符串值解析 JSON
我想从字符串转换为对象。来自 {"key1": "{\n \"key2\": \"value2\",\n \"key3\": {\n \"key4\": \"value4\"\n }\n
json - 将扁平化的 json 转换为嵌套的 json
目前我正在使用以下代码将嵌套的 json 转换为扁平化的 json: import ( "fmt" "github.com/nytlabs/gojsonexplode" ) func
json - Go:用一组 json 标签解码 json，并编码为另一组不同的 json 标签
我有一个使用来自第三方 API 的数据的应用程序。我需要将 json 解码为一个结构，这需要该结构具有“传入”json 字段的 json 标签。传出的 json 字段具有不同的命名约定，因此我需要不同
json - 将 JSON 值限制为其他 JSON 对象的名称
我想使用 JSON 架构来验证某些值。我有两个对象，称它们为 trackedItems 和 trackedItemGroups。 trackedItemGroups 是组名称和 trackedItem
json - Spark JSON 将 JSON 中完整的字段读取到案例类中
考虑以下案例类模式， case class Y (a: String, b: String) case class X (dummy: String, b: Y) 字段b是可选的，我的一些数据集没有字
json - 如何从 json 对象中获取格式化的 json 字符串？
我正在存储 cat ~/path/to/file/blah | 的输出jq tojson 在一个变量中，稍后在带有 JSON 内容的 curl POST 中使用。它运作良好，但它删除了所有换行符。我知

首页

博学

6Ren·AI

商城