gpt4 book ai didi

python - 以文本模式读取文件但也在 Python 中计算原始字节数?

转载 作者:行者123 更新时间:2023-11-28 17:40:06 24 4
gpt4 key购买 nike

我想以文本模式逐行读取文件,但同时我想插入一个中间步骤,该步骤处理字节数据并基本上计算到目前为止读取的字节数。

标准库中是否有实现此目的的好方法(无需以字节模式手动打开、搜索换行符、编码等)?最后,我需要一个文本读取对象(在 CSV 阅读器中使用),它还有一个字节计数器。

最佳答案

python 2

csv 模块在 Python 2 中处理二进制文件,因此您可以调用 file.tell() 方法来获取文件中的当前字节偏移量。

python 3

您不能使用 text_file.tell()(TextIOBase 实例)——它被记录为返回一个可能与实际字节位置不对应的不透明数字.

如果您的用例可以接受具有 ± bufsize 精度的字节偏移量,则:

file = open(filename, 'rb') # open in binary mode
text_file = io.TextIOWrapper(file, newline='') # text mode
# pass text_file to csv module
byte_offset = file.tell() # get position ± buffering

关于python - 以文本模式读取文件但也在 Python 中计算原始字节数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25620712/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com