- 使用 Spring Initializr 创建 Spring Boot 应用程序
- 在Spring Boot中配置Cassandra
- 在 Spring Boot 上配置 Tomcat 连接池
- 将Camel消息路由到嵌入WildFly的Artemis上
小屌丝:鱼哥,学习python,必须要掌握哪些库?
小鱼:这要看你从事哪方面的开发了。
小屌丝:这还有关系呢?
小鱼:那肯定的啊,
小屌丝:鱼哥,那你说,我把json库玩的特别溜,我能不能从事python后端开发??
小鱼:嗯?? 你确定你json库玩的特别溜吗?
小屌丝:那还有假,倒背如流。
小鱼:那正好,有个粉丝提问,json库存储能力差,如何能解决这个问题呢?
小屌丝:额…
小鱼:“略带微笑”… 想一想,该如何回答?
小屌丝:…这个问题,正好是我也想问你的。
小鱼:…好吧。
关于粉丝提问的如何解决json库性能差,功能少等问题,
我们可以换一个思路来理解,
是否有一个第三方josn库,可以解决这些问题呢?
答案是,肯定的。
例如:ujson库、rapidjson、simplejson、orjson等等。
但是在这些json第三方库中,又有一个,性能是碾压其他库的,
小屌丝:难道是 orjson库?
小鱼:嗯,你可算是说对一次了。
接下来,我们就来介绍orjson库。
因为orjson支持 python版本:3.7 ~ 3.10的所有64的版本。
凡是涉及第三方库,必须需要安装
老规矩,pip 安装:
pip install orjson
其它安装方式,直接看这两篇:
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import json
import orjson
import random
import time
'''
序列化
orjson 序列化结果是 bytes型
json 序列化结果 是 str型
'''
# 序列化100W个典元素的列表进行序列化
demo_json = [
{
'id' : 99999,
'value': random.uniform(0,1000)
}
for i in range(1000000)
]
运行结果
我们可以看到,json运行结果1.73s
orjson运行结果191ms
结果跟我们的预期一样,奈斯。
将JSON数据转换为Python对象的过程我们称之为反序列化,使用orjson.loads()进行操作,可接受bytes、str型等常见类型,
我们依然使用上面的代码示例。
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import json
import orjson
import random
import time
'''
反序列化
'''
# 序列化100W个典元素的列表进行序列化
demo_json = [
{
'id' : 99999,
'value': random.uniform(0,1000)
}
for i in range(1000000)
]
运行结果
orjson的序列化操作中,可以通过参数option来配置诸多额外功能,
例如:
配置option=orjson.OPT_INDENT_2,
可以为序列化后的JSON结果添加2个空格的缩进美化效果,从而弥补其没有参数indent的不足,
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import json
import orjson
demo_json = {"星星点灯":{"王心凌组":"张天爱、阿娇、阿Sa、吴谨言"},"玉":{"谭维维组":"薛凯琪、郭采洁、毛俊杰、齐溪"},"无名的人":{"郑秀妍组":["朱洁静","张俪","王紫璇","张歆艺"]}}
#默认输出结果
print(f'未配置option时,输出结果:{orjson.dumps(demo_json).decode()}')
#设置OPT_INDENT_2
print(f'已配置option后,输出结果:{orjson.dumps(demo_json,option=orjson.OPT_INDENT_2).decode()}')
运行结果
当序列化操作需要涉及多种option功能时,则可以使用|运算符来组合多个option参数即可:
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import numpy as np
import json
import orjson
'''
组合多种option
'''
demo_json = {
'zz':np.random.randint(1,10,(2,3)),
'xx':np.random.randint(1,10,(2,3)),
'aa':np.random.randint(1,10,(2,3))
}
print(orjson.dumps(demo_json,option=orjson.OPT_SERIALIZE_NUMPY | orjson.OPT_SORT_KEYS))
运行结果
orjson的一大重要特性是其可以将包含numpy中数据结构对象的复杂对象,兼容性地转换为JSON中的数组,配合option=orjson.OPT_SERIALIZE_NUMPY即可:
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import numpy as np
import json
import orjson
'''
OPT_SERIALIZE_NUMPY
'''
demo_json = {
'np':np.random.randint(1,10,(5,10))
}
demo_json
orjson.dumps(demo_json,option=orjson.OPT_SERIALIZE_NUMPY)
运行结果
除了可以自动序列化numpy对象外,orjson还支持对UUID对象进行转换,在orjson 3.0之前的版本中,需要配合option=orjson.OPT_SERIALIZE_UUID,
但是小鱼用的是3.9的版本,所以不需要额外配置参数。
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import numpy as np
import uuid
import json
import orjson
'''
OPT_SERIALIZE_UUID
'''
demo_json = {
'uuid':uuid.uuid4()
}
demo_json
orjson.dumps(demo_json)
运行结果
通过配合参数option=orjson.OPT_SORT_KEYS,可以对序列化后的结果自动按照键进行排序。
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import json
import orjson
'''
OPT_SORT_KEYS
'''
#未设置排序
orjson.dumps({"c":1,"b":11,"a":6})
#设置排序
orjson.dumps({"c":1,"b":11,"a":6},option=orjson.OPT_SORT_KEYS)
运行结果
如果需要序列化的对象中涉及到dataclass自定义数据结构时,
可以使用orjson.OPT_PASSTHROUGH_DATACLASS,
再通过对default参数传入自定义处理函数,来实现更为自由的数据转换逻辑。
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
from dataclasses import dataclass
import uuid
import orjson
@dataclass
class User:
id:str
tel_numb:int
def default(obj):
if isinstance(obj,User):
tel_numb_st = str(obj.tel_numb)
return {
'id':obj.id,
'tel_numb':f'{tel_numb_st[:3]}xxxx{tel_numb_st[-4:]}'
}
raise TypeError
demo_json = {
'user':User(id=str(uuid.uuid4()),tel_numb=13666667777)
}
orjson.dumps(demo_json,
option=orjson.OPT_PASSTHROUGH_DATACLASS,
default=default)
运行结果
代码示例
# -*- coding:utf-8 -*-
# @Time : 2022-07-03
# @Author : carl_DJ
import orjson
from datetime import datetime
def default(obj):
if isinstance(obj,datetime):
return obj.strftime('%Y年%m月%d日')
raise TypeError
demo_json = {
'now':datetime.now()
}
orjson.dumps(demo_json,
option=orjson.OPT_PASSTHROUGH_DATETIME,
default=default).decode()
运行结果
看到这里,今天的分享差不多就要结束了。
关于orjson库的知识,也讲的差不多了。
如果orjson能解决的问题,还是建议使用orjson这个第三方库。
因为不管是从性能、自由组合配置等都是吊打json库的,
但是,
对数据的处理没有那么高的要求,就是小数据量的处理,那就保持原样即可。
不管怎样,能在工作中解决掉问题,即可。
最后,再唠叨一句:
关注小鱼博客,带你学习更多关于python第三方库的知识。
运行 PostgreSQL(7.4 和 8.x),我认为这是可行的,但现在我遇到了错误。 我可以单独运行查询,它工作得很好,但如果我使用 UNION 或 UNION ALL,它会抛出错误。 这个错误:
我试图为我的应用程序创建一个导航,使用抽屉导航我的 fragment 之一(HomeFragment)有一个 ViewPager,可容纳 3 个 fragment (Bundy Clock、Annou
以我目前正在开发的应用为例: - 它有一个包含多个项目的抽屉导航;现在有两个项目让我感兴趣,我将它们称为 X 和 Y。 X 和 Y 都在单击时显示包含 x 元素或 y 元素列表的 fragment 选
我有一个形状为 (370,275,210) 的 NumPy 数组,我想将其重新整形为 (275,210,370)。我将如何在 Python 中实现这一点? 370是波段数,275是行数,210是图像包
我们如何与被子 UIViewController 阻止的父 UIViewController(具有按钮)交互。显然,触摸事件不会通过子 Nib 。 (启用用户交互) 注意:我正在加载默认和自定义 NI
我是 Jpa 新手,我想执行过程 我的代码如下 private static final String PERSISTENCE_UNIT_NAME = "todos"; private static
与安装了 LAMP 的 GCE 相比,选择与 Google Cloud SQL 链接的 GCE 实例有哪些优势? 我确定 GCE 是可扩展的,但是安装在其上的 mysql 数据库的可扩展性如何? 使用
这个问题在这里已经有了答案: Value receiver vs. pointer receiver (3 个答案) 关闭 3 年前。 我刚接触 golang。只是想了解为 Calc 类型声明的两种
我不小心按了一个快捷键,一个非常漂亮的断线出现在日期上。 有点像 # 23 Jun 2010 -------------------- 有人知道有问题的快捷方式吗?? (我在 mac 上工作!) 在
我正在Scala中编写正则表达式 val regex = "^foo.*$".r 这很好,但是如果我想做 var x = "foo" val regex = s"""^$x.*$""".r 现在我们有
以下 XML 文档在技术上是否相同? James Dean 19 和: James Dean 19 最佳答案 这两个文档在语义上是相同的。在 X
我在对数据帧列表运行稳健的线性回归模型(使用 MASS 库中的 rlm)时遇到问题。 可重现的示例: var1 <- c(1:100) var2 <- var1*var1 df1 <- data.f
好的,我有一个自定义数字键盘,可以在标签(numberField)中将数字显示为 0.00,现在我需要它显示 $0.00。 NSString *digit = sender.currentTitle;
在基于文档的应用程序中,使用 XIB 文件,创建新窗口时其行为是: 根据最后一个事件的位置进行定位和调整大小 window 。 如果最后一个事件窗口仍然可见,则新窗口 窗口应该是级联的,这样它就不会直
我想使用参数进行查询,如下所示: SELECT * FROM MATABLE WHERE MT_ID IN (368134, 181956) 所以我考虑一下 SELECT * FROM MATABLE
我遇到一些性能问题。 我有一个大约有 200 万行的表。 CREATE TABLE [dbo].[M8]( [M8_ID] [int] IDENTITY(1,1) NOT NULL,
我在 jquery 中的按键功能遇到问题。我不知道为什么按键功能不起作用。我已经使用了正确的 key 代码。在我的函数中有 2 个代码,其中包含 2 个事件键,按一个键表示 (+) 代码 107 和(
我想显示音频波形,我得到了此代码,它需要.raw音频输入并显示音频波形,但是当我放入.3gp,.mp3音频时,我得到白噪声,有人可以帮助我如何使其按需与.3gp一起使用使用.3gp音频运行它。 Inp
我无法让 stristr 函数返回真值,我相信这是因为我的搜索中有一个 $ 字符。 当我这样做时: var_dump($nopricecart); 完整的 $nopricecart 值是 $0 ,我得
如果我有这样的循环: for(int i=0;i O(n) 次。所以do some执行了O(n)次。如果做某事是线性时间,那么代码片段的复杂度是O(n^2)。 关于algorithm - 带 If 语
我是一名优秀的程序员,十分优秀!