- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的日志文件包含各种垃圾以及有用的数据。我通过匹配某些模式来提取一些信息,并能够在 python 中逐行读取文件并应用一些 if 语句时获得以下格式
job id: job#33ABC
Bin 1:30.86
Bin2: 30.86
job id: job#44BC
Bin1: 27.22
Bin2: 8.53
Bin3: 35.75
job id: job#65A
Bin2: 17.135075
Bin4: 17.135120
job id: job#P17
Bin 3: 7.328211
Bin 4: 15.918724
现在的问题是相同的日志集使用相同的作业 ID(具有不同的值)重复
job id: job#33ABC
Bin1: 99
Bin2: 1099
...
...
...
如果有某种聪明的方式以表格格式写入文件/csv,这样只需查看 job_id,它就会显示每组的所有 Bin1、Bin2 作业,现在基本上是大量重复,相同的作业来了再次使用一组不同的值,例如 job#33ABC,使用不同的值继续出现 10,11 次
job_id bin 1, bin2, bin3,bin4
set#1 set #2 set #3
job#33ABC 30.86, 30.86, 0, 0 30.86, 30.86, 0,0
job#44BC 27.22, 8.53, 35.75, 0 0,0,0,34.56
....
...
我正在逐行阅读该日志
for line in input_file:
if job_name in line:
<extract job_name logic>
print job_name[0]
if 'bin1 matches'
bin1[0]=<all logic>
print "bin1",
bin1[0]
..
...
更新我尝试使用类似的字典
records{}
for line in input_file:
if job_name in line:
<extract job_name logic>
print job_name[0]
if 'bin1 matches'
bin1[0]=<all logic>
print "bin1",
bin1[0]
records[job_name[0]]=records.get(job_name[0],[])+[bin1[0]]
if 'bin2 matches'
...
..
records[job_name[0]]=records.get(job_name[0],[])+[bin2[0]]
for key, value in records.items():
writer.writerow([key, value])
但它以以下格式呈现;
33ABC, " ['30.86','30.86','99.0','1099' ]
我的问题是我如何识别并呈现 33ABC, "['30.86','30.86',,'99.0','1099',, ] 由于必须有 4 个作业箱,所以现在它将所有值作为一个大列表,而不是分成 4 个, 4 个垃圾箱或者有什么方法可以按照当前的逻辑做到这一点?
最佳答案
抛开IO问题,你可以使用defaultdict
方便物流。或者准确地说,是 defaultdict
的 defaultdict
。
您的外部字典可以具有与作业名称相对应的键。每个作业名称的值本身就是一个字典,其键对应于 bin 名称。因此,对于每个作业名称和键名称,您尝试将一个元素附加到内部字典的值中。如果此时垃圾箱已出现,则会附加该值。如果 bin 是新的,则使用默认的空列表,并附加第一个值(仅需要 defaultdict
以避免一直测试现有键):
from collections import defaultdict
logs = defaultdict(lambda: defaultdict(list))
# simulate the following input stream:
#
# job1:
# bin1: val1
# bin1: val2
# bin2: val3
#
# job2:
# bin2: val4
#
# job1:
# bin1: val5
logs['job1']['bin1'].append('val1')
logs['job1']['bin1'].append('val2')
logs['job1']['bin2'].append('val3')
logs['job2']['bin2'].append('val4')
logs['job1']['bin1'].append('val5')
# see what we've got, converted to a non-default dict for prettiness
print({k:dict(logs[k]) for k in logs})
这将返回
{'job1': {'bin1': ['val1', 'val2', 'val5'], 'bin2': ['val3']}, 'job2': {'bin2': ['val4']}}
您可以看到值是跨作业和容器名称收集的。您可以根据自己的喜好进行写作,但我认为 CSV 在这种情况下没有意义。您可能必须使用自己的打印机。
您只需首先循环遍历日志
,这将为您提供唯一的作业名称(键),然后循环遍历给定作业的每个容器,然后打印值列表:
for lkey in logs:
# lkey is a job name, logs[lkey] is a defaultdict
print(lkey)
for bkey in logs[lkey]:
# logs[lkey][bkey] is a list of values which you can print
print(bkey)
print(logs[lkey][bkey])
上面的输出是
job1
bin1
['val1', 'val2', 'val5']
bin2
['val3']
job2
bin2
['val4']
这正是我们所期望的。
关于python,存储重复条目的智能方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39734944/
我想知道如何考虑需要您做出某些选择才能看到最终结果的搜索系统。我说的是 select 表单,您可以在其中根据您的选择继续操作,然后您会看到结果。 下面描述了我正在谈论的一个随机示例。想象一下 Init
您好,我目前正在编写一些软件来管理我们的库存。我搜索了 2 个表 master_stock(保存每一个股票代码和描述)库存(保存库存代码、地点、数量...) 一切都很好,但这是我遇到的问题。 假设我的
我有 2 个表,我想合并其数据。id 是我的关键字段(增量且不同)。表1和表2字段说明例如:id - 名称 - 值 我想将表2的所有数据插入表1,它们有不同的数据,但在某些行中有相同的id。 所以当我
我正在努力解决汇编中的一个问题,我必须获取十六进制代码的第一个字节 (FF) 并将其复制到整个值中: 0x045893FF input 0xFFFFFFFF output 我所做的
我有 Eclipse Indigo 版本,我可以在其中运行 Java 和 C++ 项目。 但我只想使用另一个 Eclipse 来编写 C++ 项目。所以我将 eclipse(不是工作区)的源文件夹复制
This question already has answers here: What is a NullPointerException, and how do I fix it? (12个答案)
This question already has answers here: Numbering rows within groups in a data frame (8个答案) 5个月前关闭。
我知道用q记录到寄存器中,但我想知道是否可以设置一些东西来快速调用最后一个记录,就像一样。 回顾最后一个简短的编辑命令(有关 的讨论请参阅 here。)。 我知道@@,但它似乎只有在执行@z之后才起作
来自 Eclipse 并且一直习惯于复制行,发现 Xcode 没有这样的功能是很奇怪的。或者是吗? 我知道可以更改系统范围的键绑定(bind),但这不是我想要的。 最佳答案 要删除一行:Ctrl-A
假设我有一个包含元素的列表,例如[1,2,3,4,5,6,7,8]。我想创建长度为 N 的该元素的所有排列。 因此,对于N = 4,它将是[[1,1,1,1],[1,1,1,2],[1,1,2,1],
我有一个带有 JMenu 的 JFrame。当我在某些情况下添加包含图像的 JPanel 时,程序首次启动时菜单会重复。调整大小时重复的菜单消失。任何建议都非常感激。谢谢。代码如下: public c
我正在尝试查找目录中文件的重复项。 我对这个 block 有一个问题,它以文件地址作为参数: public void findFiles(ArrayList list){ HashMap hm
我知道这个问题已经发布并且已经给出了答案,但我的情况不同,因为我在单个方法上填充多个下拉列表,所以如果我点击此链接 After every postback dropdownlist items re
我正在尝试为我的日历应用程序实现重复模式。我希望它的工作方式与 Outlook 在您设置重复约会时的工作方式相同。 public async Task> ApplyReccurrencePeriod
我有一个利用 cookie 来支持准向导的应用程序(即,它是一组相互导航的页面,它们必须以特定顺序出现以进行注册)。 加载 Logon.aspx 页面时 - 默认页面 - 浏览器 cookie 看起来
我有 3 个输入,代码检查它们是否为空,如果为空,则将变量值添加到输入中。 所以我有 3 个具有值的变量: var input1text = "something here"; var input2t
根据数组的长度更改数组的每个元素的最佳方法是什么? 例如: User #1 input = "XYZVC" Expected Output = "BLABL" User #2 input = "XYZ
我在让 Algolia 正常工作时遇到了一些麻烦。我正在使用 NodeJS 并尝试在我的数据库和 Algolia 之间进行一些同步,但由于某种原因似乎随机弹出大量重复项。 如您所见,在某些情况下,会弹
遵循以下规则: expr: '(' expr ')' #exprExpr | expr ( AND expr )+ #exprAnd | expr ( OR expr )+ #exprO
我有一个布局,我想从左边进入并停留几秒钟,然后我希望它从右边离开。为此,我编写了以下代码: 这里我在布局中设置数据: private void loadDoctor(int doctorsInTheL
我是一名优秀的程序员,十分优秀!