gpt4 book ai didi

python - 在 Python 中,什么类型的数据结构将允许快速搜索并且最有效?

转载 作者:太空宇宙 更新时间:2023-11-03 13:45:24 25 4
gpt4 key购买 nike

我有一个文本文件,其中列出了 10,000,000 个 YouTube 视频 ID,如下所示:

9bZkp7q19f0
t4H_Zoh7G5A
9bZkp7q19f0
etc...

我打开文件,获取 YouTube 视频 ID,并查找它的统计信息: https://www.googleapis.com/youtube/v3/videos?part=topicDetails,statistics&id=9bZkp7q19f0&key= {API_KEY} 对于第一个视频 (Psy Gangnam Style),API 调用返回:

  "viewCount": "1895378471",
"likeCount": "8110831",
"dislikeCount": "976065",
"favoriteCount": "0",
"commentCount": "5100187"

我还计算自定义值,例如每个视频在文件中包含的次数,每次递增 1。

我需要将所有这些信息记录到某种类型的 Python 数据结构中,它看起来像这样:

videoID    ,  viewCount, count, etc
9bZkp7q19f0, 1895378471, 10000
t4H_Zoh7G5A, 512345678, 10000

由于 videoIDs 在输入文件中经常重复,我不会只是将新行添加到数据结构中,而是需要能够找到现有的行,并增加计数的值。

我认为“videoID”、“count”等文本实际上不必在数据结构中,只要我知道每一列代表什么,二维类型的数组就可以了。

这个问题的重点是我试图决定哪种类型的数据结构最好。性能至关重要。

我必须能够通过 videoID 键快速确定该行是否已存在于数据结构中,因此如果我可以索引第一列,那将是理想的。

什么类型的 Python 数据结构可以实现这一点?

最佳答案

使用 videoID 作为键,将 viewCount 和 timesPreferred 的元组存储在字典中。更新每个条目将在恒定时间内运行。

对于额外的数据,请等到将数据放入数据库后再获取。在你数数的时候把东西弄得乱七八糟是没有意义的。

关于python - 在 Python 中,什么类型的数据结构将允许快速搜索并且最有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21507870/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com