gpt4 book ai didi

swift - Swift 中的 JSONSerialization.jsonObject 性能

转载 作者:搜寻专家 更新时间:2023-11-01 06:32:39 25 4
gpt4 key购买 nike

我有一个 JSON 文件(只是一个字典数组),大小为 60 兆字节。在 PHP 中解析需要 2 秒,但在 Swift 中它有七秒长。这是荒唐的。是我做错了什么还是什么?快速代码:

let json = try! JSONSerialization.jsonObject(
with: try! Data(
contentsOf: URL(
fileURLWithPath: "/some/file/path/to.json"
)
)
) as! [[AnyHashable: Any]]

我简化了代码,所以它是一个操作,但慢的部分是 JSONSerialization.jsonObject,我明确地测量了它(从文件加载数据的速度如预期的那样快)。 PHP 代码非常简单 - json_decode(file_get_contents())

值得一提的是,在 Release模式下构建(通过优化)并没有改善这种情况。

UPD:分析应用程序后,我发现瓶颈是将结果转换为 [[AnyHashable: Any]],将其更改为 [[String: Any]] 稍微改善了情况(从 7 秒到 ~ 5.3),但仍然是耻辱和痛苦。

现在的问题基本上是:为什么转换这么慢,有没有一种方法可以更快地处理大型 JSON 对象(或任何其他序列化数据)?

最佳答案

关于用 JSON 编码 60MB,我不会评判你……好吧,我要评判你一点。这是一种存储这么多数据的疯狂格式。从我的系统中得到它;让我们努力让它变得更快。

首先,你能直接跳到 Swift 4 吗?如果是这样,摆脱 JSONSerialization 并直接进入新的 JSONDecoder .它避免了很多类型问题。也就是说,它可能会或可能不会更快。

让我们回到“为什么转换这么慢”的问题。简单的。类型转换速度很快。你没有施法。你正在转换。 AnyHashable 是一个类型删除器;它是与 String 完全不同的结构类型:

public struct AnyHashable {

您必须将 String 装箱到 AnyHashable 结构中。这实际上非常快(因为写时复制的工作方式),但这意味着字典是一个完全不同的字典。你强制它制作完整的副本。

我过去处理大量 JSON 数组的方式是手动部分解析它们。扔掉第一个 [,一次收集一个 JSON 对象,解析它,然后把结果放到一个数组中。这样您就不必将所有数据都拉入内存,也不需要刻录 600MB 的高水位标记。如果您对输入 JSON 有一定的控制权,这种技术显然最有效。例如,我通常会作弊并像这样编写 JSON:

[
{ ... JSON ... },
{ ... JSON ... }
]

这使得解析记录变得非常快速和容易(只需按换行符拆分)。 (我碰巧也喜欢这个,因为它对像 grep 和 awk 这样的命令行工具很友好,根本没有 JSON 解析)。它仍然是合法的 JSON,但通过一些特殊知识我可以更快地解析它。

对于基准测试,我还建议您在 ObjC 中构建它以将 NSJSONSerialization 与“将 ObjC 类型桥接至 Swift”分开。 NSJSONSerialization 通常被认为是一个非常快速的解析器。如果您不是很小心(如上所述),那么桥接到 Swift 会很昂贵。 (我喜欢 Swift,但它是一种很难推理性能的语言。)

看起来这个空间里还有另一个玩家叫JASON ,但我还没有尝试过。 (曾经有一个非常有名的包,叫做 JSONKit,它通过玩 ObjC 技巧来疯狂地快,这会让你的皮肤起鸡皮疙瘩,但惊人地工作得非常好,所以必须原谅。但这些技巧终于 catch 了它,而且我认为它甚至不再起作用了。)

关于swift - Swift 中的 JSONSerialization.jsonObject 性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45102094/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com