- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个复杂的文件读取问题。...我需要读取带有嵌入式文件系统的DOCX文件,提取ZIP文件,并仔细阅读ZIP文件的内部目录以提取我需要的实际文件。我已经用Java成功编写了此代码,因此我知道它可以实现。但是,我想在Rust中做到这一点。
当前,我可以读取DOCX文件,遍历OLE10对象以找到所需的文件。 OLE10文件(实际上是ZIP)具有一个256字节的奇怪的提取命令 header ,我已经过去了。如果我阅读了文件流的其余部分并将其写入文件系统,它将以ZIP格式写出。我可以使用7-zip打开文件并查看所有内容。
问题是,无论我使用哪种Rust ZIP crate (zip,zip_extract,zip_extensions,rc-zip),我都无法提取ZIP内容。我不断遇到“找不到中央目录结尾”的问题。我已经遍历了该文件,并且实际上存在EOCD标记“50 4B 05 06”。如果我在EOCD处结束流,则出现“文件退出提前结束”错误。该文件> 9M,我想知道这是否是问题所在。
任何人都有如何使用Rust提取ZIP目录并将其附加到缓冲区或文件系统的想法吗?
这是不会提取的代码:
let docx_path = Path::new(docx_filename);
// Capture the files from the embedded CFB filesystem
let mut comp_file = cfb::open(docx_path).unwrap();
let objpool_entries_vec: Vec<_> = comp_file // Collect the entries of /ObjectPool
.read_storage(Path::new("/ObjectPool"))
.unwrap()
.map(|subdir| comp_file.read_storage(subdir.path().to_owned())
.unwrap()
.filter(|path| path.name().contains("Ole10Native"))
.next()
)
.filter(|entry| entry.is_some()) // Filter entries with data
.map(|entry| entry.unwrap()) // Unwrap those entries with data
.collect();
let mut ole10_stream = comp_file.open_stream(objpool_entries_vec[5].path()) // Create stream of the OLE10 file
.unwrap();
ole10_stream.seek(std::io::SeekFrom::Start(256)); // skip the 256 byte header
let mut ole_buffer = Vec::new();
ole10_stream.read_to_end(&mut ole_buffer);
let zip_cursor = Cursor::new(ole_buffer);
zip_extract::extract(
zip_cursor,
&PathBuf::from("C:\\Users\\ra069466\\Documents\\Software_Projects\\Rust_projects\\ha420_maint_app\\test_files\\"),
false)
.unwrap();
当我运行以下命令时,它将ZIP写入目录,然后可以使用7zip解压缩。但是,当尝试提取到文件系统时,它仍然会感到 panic 。
let docx_path = Path::new(docx_filename);
// Capture the files from the embedded CFB filesystem
let mut comp_file = cfb::open(docx_path).unwrap();
let objpool_entries_vec: Vec<_> = comp_file // Collect the entries of /ObjectPool
.read_storage(Path::new("/ObjectPool"))
.unwrap()
.map(|subdir| comp_file.read_storage(subdir.path().to_owned())
.unwrap()
.filter(|path| path.name().contains("Ole10Native"))
.next()
)
.filter(|entry| entry.is_some()) // Filter entries with data
.map(|entry| entry.unwrap()) // Unwrap those entries with data
.collect();
let mut ole10_stream = comp_file.open_stream(objpool_entries_vec[5].path()) // Create stream of the OLE10 file
.unwrap();
ole10_stream.seek(std::io::SeekFrom::Start(256)); // skip the 256 byte header
let mut ole_buffer = Vec::new();
ole10_stream.read_to_end(&mut ole_buffer);
let zip_cursor = Cursor::new(ole_buffer);
let mut zip_file = OpenOptions::new()
.write(true)
.create(true)
.open("C:\\Users\\ra069466\\Documents\\Software_Projects\\Rust_projects\\ha420_maint_app\\test_files\\test.zip")?;
zip_file.write_all(&mut zip_cursor.get_ref())?;
zip_file.flush();
let mut zip_file = File::open("C:\\Users\\ra069466\\Documents\\Software_Projects\\Rust_projects\\ha420_maint_app\\test_files\\test.zip")?;
let zip_archive = zip::ZipArchive::new(&zip_file)?;
zip_extract::extract(
zip_file,
&PathBuf::from("C:\\Users\\ra069466\\Documents\\Software_Projects\\Rust_projects\\ha420_maint_app\\test_files\\"),
false)
.unwrap();
最佳答案
我不能说其他的 crate ,但是zip
会自动寻找您提供的io::Read
的结尾(然后向后搜索)。在没有看到您的代码的情况下,我猜测您正在传递的阅读器超出了ZIP文件内容的末尾,因此zip
无法识别该内容。
如果您需要特定功能,请随时在our issue tracker上提出问题。如果需要,我很高兴扩展 crate 的API
Edit: I looked into the other crates you've used and they'd share this issue.
rc-zip
(The only one that doesn't usezip
under the hood) has aReadZip
trait that starts searching at the end of whatever buffer you give it. You'd need to callArchiveReader::new
with the size you expect the internal zip file to be
关于rust - Rust帮助提取ZIP内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64928982/
我有这个问题: 我们声称对 float 使用相等测试是不安全的,因为算术运算会引入舍入错误,这意味着两个应该相等的数字实际上并不相等。 对于这个程序,您应该选择一个数字 N,并编写一个程序来显示 1
为什么这个脚本的输出是 5 而不是 8 ? 我认为 -- 意味着 -1 两次。 var x = 0; var y = 10; while ( x
我现在可以从 cmd 窗口中执行的 FFmpeg 过程中读取最后一行。 使用脚本主机模型对象引用此源。 Private Sub Command1_Click() Dim oExec
使用 vlookup,当匹配发生时,我想从匹配发生的同一行显示工作表 2 中 C 列的值。我想出的公式从 C 列表 2 中获取值,但它从公式粘贴在表 3 上的行中获取,而不是从匹配发生的位置获取。 这
我在破译 WCF 跟踪文件时遇到了问题,我希望有人能帮助我确定管道中的哪个位置发生了延迟。 “Processing Message XX”的跟踪如下所示,在事件边界和传输到“Process Actio
我有四个表,USER、CONTACT、CONACT_TYPE 和 USER_CONTACT USER_CONTACT 存储用户具有填充虚拟数据的表的所有联系人如下 用户表 USER_ID(int)|
以下有什么作用? public static function find_by_sql($sql="") { global $database; $result_set = $data
我正在解决 JavaBat 问题并且对我的逻辑感到困惑。 这是任务: Given a day of the week encoded as 0=Sun, 1=Mon, 2=Tue, ...6=Sat,
我正在研究一些 Scala 代码,发现这种方法让我感到困惑。在匹配语句中,sublist@ 是什么?构造?它包含什么样的值(value)?当我打印它时,它与 tail 没有区别,但如果我用尾部替换它,
我正在使用以下代码自行缩放图像。代码很好,图像缩放也没有问题。 UIImage *originImg = img; size = newSize; if (originImg.size.width >
Instruments 无法在我的 iPad 和 iPhone 上启动。两者都已正确配置,我可以毫无问题地从 xcode 调试它们上的代码,但 Instruments 无法启动。 我听到的只是一声嘟嘟
我想用 iPhone 的 NSRegularExpression 类解析此文本: Uploaded652.81 GB 用于摘录上传和652.81文本。 最佳答案 虽然我确实认为 xml 解析器更适合解
我找到了 solution在 Stackoverflow 上,根据过滤器显示 HTML“li”元素(请参阅附件)。本质上基于 HTML 元素中定义的 css 类,它填充您可以从中选择的下拉列表。 我想
这是一个简单的问题,但我是在 SQL 2005 中形成 XML 的新手,但是用于形成如下所示表中的 XML 的最佳 FOR XML SQL 语句是什么? Column1 Column2 -
我在 www.enigmafest.com 有一个网站!您可以尝试打开它!我面临的问题是,在预加载器完成后,主页会出现,但其他菜单仍然需要很长时间才能加载,而且声音也至少需要 5 分钟! :( 我怎样
好吧,我正在尝试用 Haskell 来理解 IO,我想我应该编写一个处理网页的简短小应用程序来完成它。我被绊倒的代码片段是(向 bobince 表示歉意,但公平地说,我并不想在这里解析 HTML,只是
如何使用背景页面来突出显示网站上的某个关键字,无论网站是什么(谷歌浏览器扩展)?没有弹出窗口或任何东西,它只是在某人正在查看的网站上编辑关键字。我以前见过这样的,就是不明白怎么做!谢谢你的帮助。 最佳
我是 Javascript 新手,需要一些帮助。 先看图片: . 积分预测器应用程序。 基本上当用户通过单选按钮选择获胜团队时它应该在积分栏中为获胜队添加 10 分,并且并根据得分高的球队自动对表格进
这是我的情况 - 我要发送一份时事通讯,我试图做的是,当用户单击电子邮件中的链接时,它会重定向到我的网页,然后会弹出一个灯箱,显示视频。我无法在页面加载时触发灯箱,因为您可以在查看灯箱之前转到同一页面
我有这个代码。 ¿Cuanto es ? Ir 我想获取用户输入的“验证码”值。我尝试这个但行不通。有什么帮助吗? var campo = d
我是一名优秀的程序员,十分优秀!