Python - 如何读取带有 NUL 分隔行的文件？-6ren

Python - 如何读取带有 NUL 分隔行的文件？

转载作者：太空狗更新时间：2023-10-29 18:25:53

25

4

我通常使用以下 Python 代码从文件中读取行:

f = open('./my.csv', 'r')
for line in f:
    print line

但是如果文件是由“\0”(而不是“\n”)分隔的行呢？是否有可以处理此问题的 Python 模块？

感谢您的任何建议。

最佳答案

如果你的文件足够小，你可以将它全部读入内存，你可以使用拆分:

for line in f.read().split('\0'):
    print line

否则你可能想从关于这个 feature request 的讨论中尝试这个食谱:

def fileLineIter(inputFile,
                 inputNewline="\n",
                 outputNewline=None,
                 readSize=8192):
   """Like the normal file iter but you can set what string indicates newline.
   
   The newline string can be arbitrarily long; it need not be restricted to a
   single character. You can also set the read size and control whether or not
   the newline string is left on the end of the iterated lines.  Setting
   newline to '\0' is particularly good for use with an input file created with
   something like "os.popen('find -print0')".
   """
   if outputNewline is None: outputNewline = inputNewline
   partialLine = ''
   while True:
       charsJustRead = inputFile.read(readSize)
       if not charsJustRead: break
       partialLine += charsJustRead
       lines = partialLine.split(inputNewline)
       partialLine = lines.pop()
       for line in lines: yield line + outputNewline
   if partialLine: yield partialLine

我还注意到您的文件有一个“csv”扩展名。 Python 中内置了一个 CSV 模块(导入 csv)。有一个名为 Dialect.lineterminator 的属性然而，它目前还没有在阅读器中实现:

Dialect.lineterminator

The string used to terminate lines produced by the writer. It defaults to '\r\n'.

Note The reader is hard-coded to recognise either '\r' or '\n' as end-of-line, and ignores lineterminator. This behavior may change in the future.

关于Python - 如何读取带有 NUL 分隔行的文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9237246/

25

4

0

文章推荐： c# - 参数前的@符号是什么

文章推荐： arrays - 带有 *ngFor 的 Angular2 奇怪的形式行为

文章推荐： c# - 如何为 webBrowser 导航事件设置超时

文章推荐： forms - 使用formBuilder angular2获取 View 中的字段值

Javascript 文件崩溃并转换为 '' NUL NUL NUL"notepad++
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 7 年前。 Improve t
c - 区分嵌入式 NUL 和 NUL 终止符
我有一个 const char* 指向十六进制格式的数据，我需要找到我正在检查的数据的长度 NUL-terminator 但是当\x00 出现时它检测到它作为 NUL 终止符返回不正确的长度。我该如
windows - 当存在名为 nul 的文件时，nul 如何工作
如果 nul 永远不能成为 Windows 中的一个文件，那么如果使用对 nul 没有相同规则的操作系统在所有目录中创建一个名为“nul”的文件会怎么样。例如，如果在 CMD 中执行“echo 123
c++ - 当 NUL 字符定义为字符串的一部分时，为什么 strlen() 不计算终止 NUL 字符的字节数？
我知道 strlen() 不计算 NUL 终止字符。我真的知道这是事实。因此，这个问题并不是要问为什么 strlen() 可能“大概”不返回正确的字符串长度，这个问题已经在 StackOverfl
string - 如果 NUL 终止符不在切片的末尾，如何从以 NUL 终止的字节切片中获取 '&str'？
虽然 CStr 通常用于 FFI，但我正在读取 &[u8]，它以 NUL 结尾并确保是有效的 UTF-8，所以没有需要检查。但是 NUL 终止符不一定在切片的末尾。将此作为 &str 获取的好方法是
string - 如果 NUL 终止符不在切片的末尾，如何从以 NUL 终止的字节切片中获取 '&str'？
虽然 CStr 通常用于 FFI，但我正在读取 &[u8]，它以 NUL 结尾并确保是有效的 UTF-8，所以没有需要检查。但是 NUL 终止符不一定在切片的末尾。将此作为 &str 获取的好方法是
java - 为什么写入文件时会收到 "nul"？
我正在使用 Java BufferedWriter 逐行写入文件。问题是，当我写完文件时，它在整个文件中显示“nul”。我不认为问题出在我正在写的内容上，因为我用System.out.print仔细
r - 在数字数据的字符串中嵌入 nul
我正在使用 R 使用 fread 读取一个文件，该文件包含许多列和行。该文件如下所示: 1_17118 1_18353 1_21882 1_21955 1_22054 Ind0001 -1
c - nul 终止指针
c89 海合会 (海湾合作委员会) 4.6.3 你好，我在 *search = '\0' 上得到一个堆栈转储；我认为可以用 nul 终止一个字符串。 char *ptr_name = "hello@
c - 代码块是否声明了 NUL？
这个问题在这里已经有了答案: NUL undeclared- first use in this function (4 个答案) 关闭 8 年前。 char word[5]={"fayed"};
c# - 为什么会出现这些 nul
我曾经使用以下函数写入很多不同的文件 using (FileStream fs = new FileStream(Settings.PsLog, FileMode.Truncate, System.S
Python文件查找+写入文件中输出奇怪的 "NUL"
我正在编写一个下载器，它将 url 拆分为多个部分并使用线程下载，可能我不会使用“join”，因为 join = 无法流式传输(如果所有线程未完成，则无法写入文件) 但是问题是 f.seek 和 wr
c - NUL——手工终止一个字符串
这是我服务器端的方法: void send_err(int socket_fd, char *msg) { /// To send an error message (`ERR`).
winapi - 如何打开 "nul"文件？
我需要创建一个将标准错误流重定向到某个文件的新进程。创建子进程的代码没有可用的控制台，因此在某些情况下 GetStdHandle(any) 将返回 0。子进程将出于某种原因尝试复制其所有标准 IO 句
null - 删除 "NUL"字符
我的 Notepad++ 中有这样的字符当我尝试复制整行时，我实际上正在复制所有内容，直到“NUL”: File:1 我想做的就是替换那些空的，什么都没有，这样我就可以复制我的整行。也许有任何关键字
java - 读取字节数组直至 NUL 字符
我正在通过 Java 中的 UDP 接收带有字节数组的数据包。我知道最大可能的字节大小，但我不知道当前接收的大小。如果我从这个字节数组创建一个 String 实例，那么该字符串在有用的有效负载之后将
c - NUL undeclared- 在此函数中首次使用
来自 the web我知道 C 包含 NUL 关键字。编译时出现错误 NUL undeclared first use in this function' 我的代码片段: for (;;) {
c - 为什么需要将 NUL 字符附加到数组中？
#include #include int main() { char x[] = "Happy birthday to You"; char y[25]; char z[
C:非 NUL 终止的字符数组
我看到了here如果它不是 NULL 终止的，则不可能使用 strlen 找出 (unsigned char *) 字符串长度，因为 strlen 函数将遍历字符串但不会找到任何 '\0'，因此运行-
c - NULL 宏和 nul
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关

首页

博学

6Ren·AI

商城

Python - 如何读取带有 NUL 分隔行的文件？