python - 具有多个记录路径的 json

python - 具有多个记录路径的 json_normalize

转载作者：行者123 更新时间：2023-12-03 19:14:32

27

4

我正在使用 json_normalize 中给出的示例此处提供的文档pandas.json_normalize — pandas 1.0.3 documentation ，不幸的是，我无法粘贴我的实际 JSON，但此示例有效。从文档粘贴:

data = [{'state': 'Florida',
     'shortname': 'FL',
     'info': {'governor': 'Rick Scott'},
     'counties': [{'name': 'Dade', 'population': 12345},
                  {'name': 'Broward', 'population': 40000},
                  {'name': 'Palm Beach', 'population': 60000}]},
    {'state': 'Ohio',
     'shortname': 'OH',
     'info': {'governor': 'John Kasich'},
     'counties': [{'name': 'Summit', 'population': 1234},
                  {'name': 'Cuyahoga', 'population': 1337}]}]
result = json_normalize(data, 'counties', ['state', 'shortname',
                                           ['info', 'governor']])
result


         name  population    state shortname info.governor
0        Dade       12345   Florida    FL    Rick Scott
1     Broward       40000   Florida    FL    Rick Scott
2  Palm Beach       60000   Florida    FL    Rick Scott
3      Summit        1234   Ohio       OH    John Kasich
4    Cuyahoga        1337   Ohio       OH    John Kasich

如果 JSON 是下面的那个而不是 info 呢？是一个数组而不是一个字典:

data = [{'state': 'Florida',
     'shortname': 'FL',
     'info': [{'governor': 'Rick Scott'}, 
              {'governor': 'Rick Scott 2'}],
     'counties': [{'name': 'Dade', 'population': 12345},
                  {'name': 'Broward', 'population': 40000},
                  {'name': 'Palm Beach', 'population': 60000}]},
    {'state': 'Ohio',
     'shortname': 'OH',
     'info': [{'governor': 'John Kasich'}, 
              {'governor': 'John Kasich 2'}],
     'counties': [{'name': 'Summit', 'population': 1234},
                  {'name': 'Cuyahoga', 'population': 1337}]}]

您将如何使用 json_normalize 获得以下输出:

         name  population    state shortname info.governor
0        Dade       12345   Florida    FL    Rick Scott
1        Dade       12345   Florida    FL    Rick Scott 2
2     Broward       40000   Florida    FL    Rick Scott
3     Broward       40000   Florida    FL    Rick Scott 2
4  Palm Beach       60000   Florida    FL    Rick Scott
5  Palm Beach       60000   Florida    FL    Rick Scott 2
6      Summit        1234   Ohio       OH    John Kasich
7      Summit        1234   Ohio       OH    John Kasich 2    
8    Cuyahoga        1337   Ohio       OH    John Kasich
9    Cuyahoga        1337   Ohio       OH    John Kasich 2

或者如果有其他方法可以做到这一点，请告诉我。

最佳答案

json_normalize设计是为了方便而不是灵活性。它无法处理所有形式的 JSON(而且 JSON 太灵活，无法为其编写通用解析器)。

打电话如何json_normalize两次然后合并。这假设每个状态在您的 JSON 中只出现一次:

counties = json_normalize(data, 'counties', ['state', 'shortname'])
governors = json_normalize(data, 'info', ['state'])

result = counties.merge(governors, on='state')

关于python - 具有多个记录路径的 json_normalize，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61197756/

27

4

0

文章推荐： c# - Azure Linux Zip 部署无法正常工作 : Azure Functions App

文章推荐： string - 在批处理文件中连接字符串和数字

python - 具有多个记录路径的 json_normalize
我正在使用 json_normalize 中给出的示例此处提供的文档pandas.json_normalize — pandas 1.0.3 documentation ，不幸的是，我无法粘贴我的实际
python - json_normalize 用于字典中的字典
我一直在尝试规范化一个非常嵌套的json文件，稍后我将进行分析。我正在努力解决的是如何进一步深入到正常化。我浏览了pandas.io.json.json_normalize文档，因为它完全按照我想要
python - Pandas JSON_Normalize 仅特定列
我有一个需要展平的嵌套 JSON 结构。在使用 JSON 规范化时，它会展平所有键。但是，我想在保留嵌套的其他键的同时展平特定键。如何使用 JSON 规范化来实现这一点。我正在尝试做的事情的详细描述如
python - Pandas json_normalize KeyError
我有一个没有统一结构的嵌套 json 文件，如下例所示: [{ "name": "Jon", "last": "Jonny"}, {"name": "Jimmy", "last": "johnson
json - pandas json_normalize 展平嵌套字典
我正在尝试使用 json_normalize 来展平嵌套字典。我的数据是这样的: data = [ {'gra': [ { 'A': 1,
python - 如何正确 json_normalize 以便我以正确的格式获取数据帧？
我正在使用亚马逊数据集来回答问题。亚马逊的代码是: import pandas as pd import gzip def parse(path): g = gzip.open(path, 'r
Python pandas json_normalize 如何
我正在尝试创建一个 API，从 poloniex 获取历史数据，供我的神经网络用于学校项目的学习。我得到一个json文件，但问题是poloinex_df是“空”，所有信息都在index/column
python - pandas json_normalize 所有列都有嵌套字典扁平化
我有一个嵌套字典 (json)，它是从非官方谷歌字典 API 返回的。看起来像这样: {'word': 'slack', 'phonetic': '/slak/', 'meaning': {'a
python - 将 json_normalize 用于带有列表的结构化多级字典
我已经使用以下迭代方法: for k, v in enumerate(my_request['content']): for k1, v1 in enumerate(v['data']['sc
python - Pandas json_normalize 不会展平所有嵌套字段
我正在分析一个 json 文件，我想将嵌套的 json 输入文件转换为 python 中的平面数据框。有没有任何 python 方法可以管理这个？或者我应该创建一个自定义函数来做到这一点？您能提供一个
python - 使用 json_normalize 从多个级别获取元值
假设这是我的 JSON: ds = [{ "name": "groupa", "subGroups": [{ "subGroup": 1,
python - 当 json_normalize 无法迭代列以展平时如何修复它？
我有一个如下所示的数据框: ID phone_numbers 1 [{u'updated_at': u'2017-12-02 15:29:54', u'created_at'
python - 我如何 json_normalize() df 中的特定字段并保留其他列？
这个问题在这里已经有了答案: Split / Explode a column of dictionaries into separate columns with pandas (13 个答案)
python - 如何使用 NaN 对列进行 json_normalize
此问题特定于 pandas.DataFrame 中的数据列这个问题取决于列中的值是否为 str , dict , 或 list类型。这个问题解决了如何处理 NaN值，当 df.dropna().r
python - 如何使用 json_normalize 规范化嵌套的 json
我正在尝试从嵌套的 json 中创建一个 Pandas 数据框。由于某种原因，我似乎无法解决第三个层次。我的 json 看起来像这样: "numberOfResults": 376, "re
python - 如何在整个 Pandas 列上应用 json_normalize
我有一个带有 LISTS(with dicts) 作为列值的数据框。我的目的是规范整列(所有行)。我找到了标准化单行的方法。但是，我无法对整个数据框或列应用相同的功能。 data = {'COLUMN
python - 使用 pd.json_normalize 展平字典
我目前正在对这个字典文件进行扁平化处理，遇到了一些障碍。我正在尝试使用 json_normalize 来展平这些数据。如果我对单个实例进行测试，它可以工作，但如果我想展平所有数据，它将返回一个错误，指
python - 使用 pd.json_normalize 展平字典
我目前正在对这个字典文件进行扁平化处理，遇到了一些障碍。我正在尝试使用 json_normalize 来展平这些数据。如果我对单个实例进行测试，它可以工作，但如果我想展平所有数据，它将返回一个错误，指
python - 使用 json_normalize 通过嵌套数组规范化 json
我想标准化以下 JSON: [ { "studentId": 1, "studentName": "James", "schools": [
python - 使用 json_normalize 展平嵌套的 json
我正在尝试在 Python (Pandas) 中使用 json_normalize 来展平 json 文件，但作为菜鸟，我似乎总是以 KeyError 告终。我想要实现的是一个包含游戏中所有 Pla

首页

博学

6Ren·AI

商城

python - 具有多个记录路径的 json_normalize