gpt4 book ai didi

python - 有没有办法通过正则表达式搜索快速删除大量多余的数据?

转载 作者:太空宇宙 更新时间:2023-11-03 21:00:27 25 4
gpt4 key购买 nike

我正在尝试提取一些数据以将数据输入到服务器中。我从 Web API 获取了数据,其中包含很多对我来说都是垃圾的信息。我需要摆脱大量的东西,但我不知道从哪里开始。我需要的数据直到“能力”,然后再次从“名称”:“Contherious”开始。 And here's that link 。我所做的大部分数据处理一直在尝试使用正则表达式搜索来尝试处理此问题,我能想到的唯一搜索是在我需要的名称与我不需要的名称之间进行搜索空格并直接引导至其后的 ID。我只是不清楚如何获取这些名称中的每一个,任何帮助将不胜感激。

我已经尝试过

DMG_DONE_FILE = "rawDmgDoneData.txt"

out = []

with open(DMG_DONE_FILE, 'r') as f:
line = f.readline()
while line:
regex_id = search('^+"name":"\s"+(\w+)+"id":',line)
if regex_id:
out.append(regex_id.group(1))

line = f.readline()

并且我收到错误,因为我通常不知道我在使用正则表达式搜索做什么

最佳答案

import sys
import json

# use urllib to fetch from api
# example here for testing is reading from local file
f=open('file.json','r')
data=f.read()
f.close()
entries = json.loads(data)

现在您有了一个可以轻松寻址的数据结构

例如条目['条目'][0]['名称']

或者使用 jq https://stedolan.github.io/jq/

cat file.json |jq '.entries[]| {name:.name,id:.id,type:.type,itemLevel:.itemLevel,icon:.icon,total:.total,activeTime:.activeTime,activeTimeReduced:.activeTimeReduced}'

关于python - 有没有办法通过正则表达式搜索快速删除大量多余的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55737966/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com