Python3.0 : tokenize & BytesIO-6ren

Python3.0 : tokenize & BytesIO

转载作者：行者123 更新时间：2023-12-01 06:19:49

25

4

尝试在 python3.0 中对字符串进行标记化时，为什么在标记开始之前会出现前导 'utf-8'？

来自python3 docs , tokenize 现在应该按如下方式使用:

g = tokenize(BytesIO(s.encode('utf-8')).readline)

但是，当在终端上尝试执行此操作时，会发生以下情况:

>>> from tokenize import tokenize
>>> from io import BytesIO
>>> g = tokenize(BytesIO('foo'.encode()).readline)
>>> next(g)
(57, 'utf-8', (0, 0), (0, 0), '')
>>> next(g)
(1, 'foo', (1, 0), (1, 3), 'foo')
>>> next(g)
(0, '', (2, 0), (2, 0), '')
>>> next(g)

前面的 utf-8 标记是怎么回事？这应该发生吗？如果是这样，那么我应该总是跳过第一个标记吗？

[编辑]

我发现 token 类型 57 是 tokenize.ENCODING ，如果需要，可以轻松地从 token 流中过滤掉。

最佳答案

这是源代码的cookie。您可以明确指定一个:

# -*- coding: utf-8 -*-
do_it()

否则 Python 会采用默认编码，即 Python 3 中的 utf-8。

关于Python3.0 : tokenize & BytesIO，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/913409/

25

4

0

文章推荐： sql-server - 错误 : No process is on the other end of the pipe

文章推荐： java - 写入随机访问文件

文章推荐： jquery获取href值新选择的类

文章推荐： cuda 6统一内存段错误

python - 在 python 中将 BytesIO 添加到 BytesIO tar.gz
我在 Python 中从 BytesIO 对象编写 .tar.gz 文件时遇到问题。只编写一个普通的 tarfile 效果很好，但是如果我将写入模式更改为 .tar.gz(或 bz 或 xz)，它不会
python - 为什么我必须从 BytesIO 转换字节，然后再转换回 BytesIO，以便可以将其读取为 PDF 文件响应？
我使用PyPDF4来合并pdf文件，然后使用合并后的pdf作为HttpResponse。我使用 BytesIO 来获取 PdfFileMerger 的结果。我使用这段代码让它工作 def merge
python - 从 io 导入 BytesIO ImportError : cannot import name BytesIO
当我尝试使用 python "c:\Django\blongo\blongo\blog\manage.py" runserver 我得到: File "C:\Python27\lib\site-pac
python - BytesIO 类文件对象
我无法理解这两个 BytesIO 对象的区别。如果我这样做: f = open('decoder/logs/testfile.txt', 'rb') file = io.BytesIO(f.read(
python - BytesIO 对象到图像
我正在尝试在我的程序中使用 Pillow 将相机中的字节串保存到文件中。这是一个示例，其中包含来 self 的相机的一个小原始字节字符串，它应该表示分辨率为 10x5 像素的灰度图像，使用 LSB 和
python - 使用函数打开文件(类型为 BytesIO)
我有以下代码: 这部分在内存中生成 CSV: def to_csv(events: list) -> io.BytesIO(): if not events: return N
python - BytesIO.truncate 方法不扩展缓冲区内容
IOBase.truncate 的文档方法说: truncate(size=None) Resize the stream to the given size in bytes (or the cur
Python3.0 : tokenize & BytesIO
尝试在 python3.0 中对字符串进行标记化时，为什么在标记开始之前会出现前导 'utf-8'？来自python3 docs , tokenize 现在应该按如下方式使用: g = tokeni
python - 创建 bytesIO 对象
我正在开发 Scrapy Spider，尝试使用 slate 从目录中的多个 PDF 文件中提取文本。我对将实际的 PDF 保存到磁盘没有兴趣，因此建议我查看 io.bytesIO 子类 https:
python - 为什么截断 BytesIO 会把它搞砸？
在 OSX 上的 Python 3.5.1 上运行: import io b = io.BytesIO() b.write(b'222') print(b.getvalue()) b.truncate
python - 写入然后读取内存字节 (BytesIO) 给出空白结果
我想试试 python BytesIO 类。作为一个实验，我尝试写入内存中的 zip 文件，然后从该 zip 文件中读取字节。因此，我没有将文件对象传递给 gzip，而是传递了一个 BytesIO
python - 将 BytesIO 转换为文件
我有一个包含 excel 文档数据的 BytesIO 对象。我要使用的库不支持 BytesIO 并且需要一个 File 对象。如何获取我的 BytesIO 对象并将其转换为 File 对象？最佳答案
python - Librosa 无法从 BytesIO 加载
我目前正在尝试创建一个用于深度学习的大型数据集，其中包含大量存储在一起的压缩 mp3 文件，因此我没有 10 万个文件必须单独加载。 x = b'' with open("file1.mp3", "r
python - 从内存中读取字节 io.BytesIO 后是否可以删除它们？
我想使用 io 中的 BytesIO 类来创建数据流，但是如果我通过它传输大量数据，它会占用大量内存，所以我问是否可以释放“旧”使用的内存“我已经阅读过的数据。如果 io 模块无法做到这一点，我愿意
python - BytesIO - 从 s3 下载文件对象但字节流为空
查看底部的更新 - 问题略有变化我正在尝试使用 boto3 的 .download_fileobj 方法将文件从 s3 下载到类似文件的对象，但是当我尝试检查下载的字节流时，它是空的。但是我不确定我
python - Discord 使用 BytesIO 发送空白文本文件
我正在尝试使用 discord.py 发送一个文本文件，但是当我发送该文件时，它似乎是空的。一个示例片段: bytes = BytesIO() test = b'sadfasdfsa' bytes.
Python 3.5 BytesIO 错误
我正在用 python 2.7 制作一个项目，但由于文档是用 python 3.5 编写的，所以它开始在最后部分给我带来一些错误。所以我将所有内容更改为 python 3.5，但由于 bytesIO，
python - 从 BytesIO 将图像上传到 ImageField
我想直接在模型保存中上传生成的图像，而不必先将其保存到文件中。型号: avatar = models.ImageField(upload_to="img/", null=True, blank=Tr
Python3 PyPDF2 - 如何将文件处理程序视为 BytesIO 对象？
有一段不错的、经过测试的 python PyPDF2 代码，一个 .py 设计用于在“真实”操作系统文件上运行。调试完所有内容后，我现在正尝试将其合并到 plPython 函数中，用 io.Bytes
python - 如何从 StringIO、BytesIO 等中删除字节
我想将 BytesIO 对象用作连续缓冲区(常见用例)。但是，是否可以从头部删除不再需要的字节？看起来不像，因为只有一个 truncate() 方法。 ['__class__', '__delatt

首页

博学

6Ren·AI

商城

Python3.0 : tokenize & BytesIO

[编辑]