gpt4 book ai didi

python - 解析 Pandas 数据框

转载 作者:行者123 更新时间:2023-11-28 20:16:21 25 4
gpt4 key购买 nike

我在从 XML 解析的单个数据框中有以下数据

index                               xml_data    
0 \n
1 sessionKey
2 JKX6G3_07092016_1476953673631
3 \n
4 Number
5 JKX6G3
6 \n
7 CreateDate
8 1468040400000
9 \n
10 Id
11 83737626
12 1
13 \n
14 customerAge
15 64
16 1

我喜欢在 "\n"之后的每一行都是一列,与该列关联的值是下一行,例如:

sessionKey  Number  CreateDate  Id  Age

JKX6G3_07092016_1476953673631 JKX6G3 1.46804E+12 83737626 64

是否有比以下更优雅的方法:对于 doc_df.itertuples() 中的行:遍历每一行并解析?

最佳答案

我会查找 \n 的位置并添加 1 来定位键,添加 2 来定位值。然后构建一个数组和一个后续的dataframe

v = df.xml_data.values
a, b = np.where(v == '\\n')[0][None, :] + [[1], [2]]
pd.DataFrame([v[b]], columns=v[a])

sessionKey Number CreateDate Id customerAge
0 JKX6G3_07092016_1476953673631 JKX6G3 1468040400000 83737626 64

关于python - 解析 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43432751/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com