gpt4 book ai didi

python - 解析主键不唯一的 CSV 中的唯一值

转载 作者:太空宇宙 更新时间:2023-11-03 16:55:06 25 4
gpt4 key购买 nike

这看起来很微不足道。一般来说,我会做如下的事情:

results = []
reader = csv.reader(open('file.csv'))
for line in reader: # iterate over the lines in the csv
if line[1] in ['XXX','YYY','ZZZ']: # check if the 2nd element is one you're looking for
results.append(line) # if so, add this line the the results list

但是,我的数据集的格式并不那么简单。它看起来像下面这样:

Symbol,Values Date
XXX,8/2/2010
XXX,8/3/2010
XXX,8/4/2010
YYY,8/2/2010
YYY,8/3/2010
YYY,8/4/2010
ZZZ,8/2/2010
ZZZ,8/3/2010
ZZZ,8/4/2010

本质上,我想做的是解析列表中每​​个唯一符号的第一个日期,以便我最终得到以下结果:

XXX,8/2/2010
YYY,8/2/2010
ZZZ,8/2/2010

最佳答案

Pandas可能有帮助。 ;-)

import pandas
pandas.read_csv('file.csv').groupby('Symbol').first()

关于python - 解析主键不唯一的 CSV 中的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35474876/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com