python - 发送稀疏文件-6ren

python - 发送稀疏文件

转载作者：塔克拉玛干更新时间：2023-11-03 00:44:57

25

4

我一直在研究 Python 中的套接字，我希望能够将稀疏图像文件从一台机器发送到另一台机器。正如预期的那样，通过 python 套接字发送稀疏文件不会保留文件的稀疏性。我想做一个稀疏的 tar 并以这种方式发送，但我就是想不通。

tarfile 模块说它支持读取 GNU 格式的稀疏文件，这对我创建它们没有帮助……但是 python 文档说 Pax 格式“几乎没有限制”。我不确定这是否意味着我可以创建存档并保留稀疏文件或不使用 pax 格式...我一直在尝试，但我只是不知道它如何工作。

如果这个解决方案不是一个选项，是否有任何其他方法可以通过套接字发送稀疏文件？我讨厌通过我的应用程序的系统命令调用“tar -xSf”...

谢谢，

服务器

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
s.bind((socket.gethostname(), 50001))
s.listen(1)

img = open('test.img', 'rb')

client, addr = s.accept()
l = img.read(8192)

while(l):
        client.send(l)
        l = img.read(8192)

img.close()
s.close()

客户端

host = ''
port = 50001

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
s.connect((host, port))

img = open('./newimg.img', 'wb')

l = s.recv(8192)

while(l):
    img.write(l)
    l = s.recv(8192)

img.close()
s.close()

在服务器上，我创建了一个新的稀疏文件:truncate -s 1G test.img

a du -h 显示:0 test.img

我运行我的服务器和客户端。这是传输文件的 du -h:1.0G newimg.img

如您所见，它扩展了文件并且不再稀疏。

最佳答案

如果您写入文件的开头，查找到结尾并在那里写入，通常会在文件中创建空洞。如果您读取文件，即使文件中有漏洞，您也正在读取零。当您发送文件时，文字字节会被发送，当然也会被读取。当您随后写入字节时，所有字节都将被写入，并且不会发生文件系统创建漏洞的情况。

为了缓解这种情况，您可以先寻找文件中的漏洞，将漏洞发送到漏洞所在的位置，然后再发送文件的其余部分。

以下内容未经完善，但应该能为您提供一个起点。

import os

f = open(path, "b")
fd = f.fileno()

end = os.stat(fd).st_size
holes = []
offset = os.lseek(fd, 0, os.SEEK_HOLE)
while offset != end:
    end_hole = os.lseek(fd, offset, os.SEEK_DATA)
    holes.append((offset, end_hole))
    offset = end_hole

[open socket and stuff]

# send the holes

socket.write(json.dumps(holes)) # encode appropriately

# send file

f.seek(0)
total = 0
for hole in holes:
    while total < hole[0]:
        l = f.read(8192)
        if len(l) + total > hole[0]:
            socket.write(l[:len(l) + total - hole[0]])
            l.seek(hole[1])
            total += len(1) + total - hole[0]
        else:
            socket.write(l)
            total += len(l)

然后在客户端:

still_json = True
a = []
l = s.recv(8192)

while(still_json):
    a.append(l)
    if check_json_end(l):
        still_json = False
    else:
        l = s.recv(8192)

holes = parse_json(a) # the last chunk can contain something that is not json
# I asume that a still contains the bytes that are not json

fout = open(outfile, "wb")
total = 0

fout.write(a[0]) # handle the case where the first rest after the json in a is already after a hole

total += len(a[0]) 

for hole in holes:
    while total < hole[0]:
        l = socket.recv(8192)
        if len(l) + total > hole[0]:
            fout.write(l[:len(l) + total - hole[0]])
            fout.seek(hole[1])
            fout.write(l[len(l) + total - hole[0]:])
        else:
            fout.write(l)
        total += len(l)

其中可能有很多错误，你应该重新考虑每一行，但总的原则应该没问题。 JSON 当然是任意选择的，在这种情况下可能还有其他更好的协议(protocol)。您也可以创建自己的。

关于python - 发送稀疏文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38227854/

25

4

0

文章推荐： x11 - 无法在 XGrabKeyboard 之后移动窗口

文章推荐： android - Map> 的 AutoValue Gson 类型适配器

ios - 如何从 Node js 发送 voip 推送通知？我可以从 curl 发送 voip 推送，但不能从 Node 发送
我正在使用 voip 推送通知制作 ios 应用程序。我想从 Node js 发送 voip 推送通知，但不是很好。我阅读了本教程 CallKit iOS Swift Tutorial for V
C套接字编程，发送
我编写了一个服务器，当浏览器尝试连接到某些站点时，它会检查黑名单并发回 404，但是当我调用 send() 时没有错误，但消息不会出现在网络上浏览器，除非我关闭连接？有什么建议吗？接受来自浏览器的
发送 EOF 后无法读取任何内容？
#include int main() { char c = getchar(); //EOF (ctrl + d ) while( ( c = getchar() ) != '?'
powershell - 发送-替换HTML电子邮件
我正在尝试使用MailMessage对象通过PowerShell发送电子邮件。该脚本使用Import-CSV来使用文件，然后在电子邮件正文中使用ConvertTo-HTML。由于我要发送的电子邮件客户
Powershell - 发送/接收的字节数
我需要创建一个脚本，每 30 秒对网络流量进行一次采样并存储发送/接收的字节。该数据随后用于绘制图形。我编写了一个在 Windows 2012 上完美运行的程序，但我意识到某些 cmdlet 在以前的
AutoIt:发送 ("{DOWN}")不起作用
我正在运行“autoit3.chm”文件。当它运行时，我想发送一个向下键箭头，但它不起作用: $file = FileGetShortName("C:\Users\PHSD100-SIC\Deskto
c - 发送()问题
当我使用网络浏览器测试我的程序时，我可以很好地写入套接字/FD，所以我决定循环它并在连接中途切断连接，我发现了一个问题。 send() 能够在套接字不可用时关闭整个程序。我认为问题在于该程序陷入了第
AutoIt:发送 ("{DOWN}") 不工作
我正在运行“autoit3.chm”文件。当它运行时，我想发送一个向下键箭头，但它不起作用: $file = FileGetShortName("C:\Users\PHSD100-SIC\Deskto
java - 发送/接收数据出现问题
所以我试图向自己发送数据并接收数据然后打印它，现在我已经测试了一段时间，我注意到它没有发送任何东西，事实上，也许它是，但我没有正确接收它，我需要这方面的帮助。这就是我用来发送数据的
java - 发送/序列化对象的最佳实践
问题:开发人员创建自己的序列化格式有多常见？具体来说，我使用 java 本质上将对象作为一个巨大的字符串发送，并用标记来分隔变量。我的逻辑:我选择这个是因为它几乎消除了语言依赖性(忽略java的修改
ethernet - 发送/接收原始以太网帧
我必须在 Linux 上编写一个应用程序，该应用程序需要与具有自定义以太网类型的设备进行通信。甚至在如何编写这样的应用程序中也有很多解决方案。一个缺点是需要 root 访问权限(AFAIK)。之后释放
javascript - 单选按钮值在提交表单时作为 "on"发送
我有一个包含三个单选按钮选项的表单。我需要将表单数据提交到另一个文件，但由于某种原因，发送的数据包含所选单选按钮的值“on”，而不是 value 属性的值。我尝试通过 post() 函数手动操作和发
c - 如何使具有两个线程的两个进程在MPI中相互接收、发送？
基本上我想实现这样的目标: Process 1 Thread 1 Receive X from process 2 Thread 2 Receive Y from proces
java - 发送 session
我目前正在 Google App Engine 上开发一个系统，对它还很陌生，我正在使用 Java 平台进行开发。我在 servlet 之间发送 session 对象时遇到问题。我已经在 appeng
javascript - 发送 $(this) 作为参数
当我尝试将“this”(触发的元素)作为参数发送给函数时，函数收到“Object[Document build.php]”作为参数，而不是触发的元素。请让我知道我的错误: function set(a
android 响应联系人 > 发送？
我正在寻找让我的应用响应联系人 > 发送的魔法咒语。我希望能够接收联系人的 URI 以便检索联系人。谁有 list 过滤器/代码 fragment 吗？最佳答案我没有睾丸，但您可以尝试基于 ACT
c++ - 发送/接收套接字阻塞问题
关于我心爱的套接字的另一个问题。我先解释一下我的情况。之后我会告诉你是什么困扰着我。我有一个客户端和一个服务器。这两个应用程序都是用 C++ 编写的，实现了 winsock2。连接通过 TCP 和
C 发送/返回带有函数的数组
我看到了这篇文章 http://www.eskimo.com/~scs/cclass/int/sx5.html 但这部分让我感到困惑:如果我们已经使用 send_array 或 send_array_
c - 发送:无效参数
我对这行代码有疑问。我必须将一个数据包带到一个端口并重新发送到接口(interface)(例如:eth0)。我的程序成功地从端口获取数据包，但是当我重新发送(使用 send())到接口(interfa
发送 X11 鼠标事件的正确方法
我正在尝试编写一个 X11 输入驱动程序，它可以使用我的 Android 手机上的触摸屏来移动和单击鼠标。我可以正常移动鼠标，但我无法让应用程序正确识别点击。我当前的代码位于 https://gist

首页

博学

6Ren·AI

商城

python - 发送稀疏文件