gpt4 book ai didi

python - 将 .txt 文件处理成字典 (Python v2.7)

转载 作者:太空宇宙 更新时间:2023-11-04 10:58:10 39 4
gpt4 key购买 nike

我目前正在寻找处理和解析来自 this .txt file 的信息.该文件似乎是制表符分隔的。我希望将以 16 为基数的值(即 000000)解析为字典键,并将公司名称(即 Xerox Corporation)解析为字典值。因此,例如,如果我在字典中查找键 000001,Xerox Corporation 将作为相应的值返回。

我已经尝试将 .txt 文件解析为 csv,读取每第 n 行的条目,但不幸的是没有模式,第 n 个数字也不同。

有没有什么方法可以捕获术语“base 16”之前的值,然后捕获它后面的术语以构成字典条目?

非常感谢

最佳答案

Well 条目用两个换行符分隔。第二行始终是 base16。第一个tab前的数据是base16键,最后一个是公司名。

import urllib

inputfile = urllib.urlopen("http://standards.ieee.org/develop/regauth/oui/oui.txt")
data = inputfile.read()

entries = data.split("\n\n")[1:-1] #ignore first and last entries, they're not real entries

d = {}
for entry in entries:
parts = entry.split("\n")[1].split("\t")
company_id = parts[0].split()[0]
company_name = parts[-1]
d[company_id] = company_name

部分结果:

40F52E: Leica Microsystems (Schweiz) AG
3831AC: WEG
00B0F0: CALY NETWORKS
9CC077: PrintCounts, LLC
000099: MTX, INC.
000098: CROSSCOMM CORPORATION
000095: SONY TEKTRONIX CORP.
000094: ASANTE TECHNOLOGIES
000097: EMC Corporation
000096: MARCONI ELECTRONICS LTD.
000091: ANRITSU CORPORATION
000090: MICROCOM
000093: PROTEON INC.
000092: COGENT DATA TECHNOLOGIES
002192: Baoding Galaxy Electronic Technology Co.,Ltd
90004E: Hon Hai Precision Ind. Co.,Ltd.
002193: Videofon MV
00A0D4: RADIOLAN, INC.
E0F379: Vaddio
002190: Goliath Solutions

关于python - 将 .txt 文件处理成字典 (Python v2.7),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8068138/

39 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com