gpt4 book ai didi

python - 如何读取 Pandas 时间戳范围内的 CSV 值?

转载 作者:太空宇宙 更新时间:2023-11-04 09:59:43 25 4
gpt4 key购买 nike

我有一个包含许多列的大型 CSV 文件,以及一个 Timestamp 列。文件按时间戳的升序排序。

我想将这些值读入 pandas 数据帧,但仅限于特定时间戳范围内,比如特定日期的下午 4:00 到下午 5:00。

最有效的方法是什么?该文件非常大,我想避免完全遍历它,因为它已排序我希望它在达到上限时间戳时被切断,并且还想避免手动拆分,有没有办法使用 pandas read_csv 函数来做到这一点?

import pandas as pd
df = pd.read_csv('csvfile', header='infer', ???)

最佳答案

没有内置方法可以使用 read_csv() 在时间戳处停止。在此处查找文档:

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

有一种方法可以通过将非常大的文件分成 block 来处理它:

http://pandas.pydata.org/pandas-docs/stable/io.html#io-chunking

一种策略是找到最接近时间戳的值是 argsort()。获取最接近您的开始时间的项目的位置,并获取最接近您的结束时间的项目的位置,然后获取它们之间的值。我不会为您编写代码,但我认为这种方法应该可行。

检查一下:How do I find the closest values in a Pandas series to an input number?

关于python - 如何读取 Pandas 时间戳范围内的 CSV 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44253026/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com