gpt4 book ai didi

python - 我们可以通过 python 获取文件的唯一 ID 吗?

转载 作者:太空宇宙 更新时间:2023-11-03 14:12:09 24 4
gpt4 key购买 nike

我只是在寻找存储在目录中的文件是否有任何特定的 ID 如果是,我们如何通过 python 获取该文件。我已经尝试过这个并且我得到了一份字典。但我在任何地方都看不到任何唯一的 ID。

import os
cur = os.getcwd()

info = os.stat(cur)
print(info.__str__())

我有这样的东西:

os.stat_result (st_mode=33204, st_ino=21511460, st_dev=2049, st_nlink=1, st_uid=1001, st_gid=1001, st_size=378, st_atime=1516787918, st_mtime=1516787918, st_ctime=1516787918)

我提到了 st_ino ,这意味着 inode 号。但是当我尝试使用程序时,我发现它有时也会发生变化。
如果有任何此类 ID 可用,我们可以使用这些 ID 获取文件吗?

编辑: 因为变量拥有一个id。我想知道创建文件时文件系统中是否有类似的文件。

最佳答案

最接近文件 ID 的东西(在文件系统中标识文件的一些唯一编号)称为 inode ,这实际上是 stat 在字段 st_ino 中返回的编号。

在某些情况下,即使文件名不变,该数字也可能会发生变化,例如,当文件被另一个文件(副本)替换或删除并重新创建时。

如果您只是打开文件并对其执行读写操作,则该数字不会改变。

查看这里有关 inode 的更详细说明 https://github.com/angrave/SystemProgramming/wiki/File-System,-Part-2:-Files-are-inodes-(everything-else-is-just-data...)

另请注意,并非所有文件系统都有 inode,这是起源于 Unix 的概念。 vfat 没有这样的事情。

如果您只对文件名感兴趣,获取唯一编号的另一种方法是将文件名扩展到文件系统根目录(或 Windows 上的驱动器)的完整路径,然后调用 hash() 在字符串上。

你这样做会失去的是,在某些文件系统上,可以使用多个名称(硬链接(hard link)或软链接(soft link),我不会在此处扩展差异)来访问磁盘上的给定文件。根据您的使用情况,这可能是也可能不是问题。

如果您正在寻找具有相同内容的文件,那就又是另一回事了。文件系统不关心文件的内容。要知道两个文件是否相同,您必须打开它们并进行比较。使用 python 你应该看看 filecmp 模块。

比较多个文件的常见方法是依赖文件内容的哈希签名。例如,查看该答案,了解如何对 MD5 执行此操作(有点过时,但很容易适应更现代的签名)Generating a MD5 signature of a file

关于python - 我们可以通过 python 获取文件的唯一 ID 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48420022/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com