gpt4 book ai didi

java - TPath 访问文件时忽略大小写 [Java TrueZip]

转载 作者:行者123 更新时间:2023-11-30 06:50:34 25 4
gpt4 key购买 nike

有没有办法使用 TrueZip 访问存档内的文件,同时忽略文件名大小写?

想象一下以下 zip 存档的内容:

MyZip.zip
-> myFolder/tExtFile.txt
-> anotherFolder/TextFiles/file.txt
-> myFile.txt
-> anotherFile.txt
-> OneMOREfile.txt

它是这样工作的:

TPath tPath = new TPath("MyZip.zip\\myFolder\\tExtFile.txt");
System.out.println(tPath.toFile().getName()); //prints tExtFile.txt

如何执行相同操作但忽略所有大小写,如下所示:

// note "myFolder" changed to "myfolder" and "tExtFile" to "textfile"    
TPath tPath = new TPath("MyZip.zip\\myfolder\\textfile.txt");
System.out.println(tPath.toFile().getName()); // should print tExtFile.txt

上面的代码抛出FsEntryNotFoundException ...(没有这样的条目)

它适用于常规 java.io.File,不知道为什么不适用于 TrueZip 的 TFile 或者我丢失了一些东西?

我的目标是仅使用文件和文件夹的小写字母来访问每个文件。

编辑:2017年3月24日

假设我想从上述 zip 存档内的文件读取字节 MyZip.zip

Path tPath = new TPath("...MyZip.zip\\myFolder\\tExtFile.txt");
byte[] bytes = Files.readAllBytes(tPath); //returns bytes of the file

上面的这个代码片段可以工作,但是下面的这个代码片段不行(提到的抛出 -> FsEntryNotFoundException)。它是相同的路径和文件,只是小写。

Path tPath = new TPath("...myzip.zip\\myfolder\\textfile.txt");
byte[] bytes = Files.readAllBytes(tPath);

最佳答案

你说:

My goal is to access each file just using only lowercase for files and folders.

但是一厢情愿的想法不会让你走得太远。事实上,大多数文件系统(Windows 类型除外)都是区分大小写的,即在其中使用大写或小写字符会产生很大的差异。您甚至可以在同一目录中多次使用不同大小写的“相同”文件名。 IE。如果名称是 file.txtFile.txtfile.TXT,实际上会有所不同。 Windows 确实是一个异常(exception),但 TrueZIP 并不模拟 Windows 文件系统,而是模拟适用于所有平台上的 ZIP、TAR 等的通用存档文件系统。因此,您无法选择使用大写还是小写字符,但必须完全按照 ZIP 存档中存储的方式使用它们。

<小时/>

更新:作为一个小证明,我登录到具有 extfs 文件系统的远程 Linux 机器并执行了以下操作:

~$ mkdir test
~$ cd test
~/test$ touch file.txt
~/test$ touch File.txt
~/test$ touch File.TXT
~/test$ ls -l
total 0
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.TXT
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.txt
-rw-r--r-- 1 group user 0 Mar 25 00:14 file.txt

正如您可以清楚地看到的,存在三个不同的文件,而不仅仅是一个。

如果将这三个文件压缩到存档中会发生什么?

~/test$ zip ../files.zip *
adding: File.TXT (stored 0%)
adding: File.txt (stored 0%)
adding: file.txt (stored 0%)

添加了三个文件。但它们在存档中仍然是不同的文件还是只是存储在同一个名称下?

~/test$ unzip -l ../files.zip
Archive: ../files.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-03-25 00:14 File.TXT
0 2017-03-25 00:14 File.txt
0 2017-03-25 00:14 file.txt
--------- -------
0 3 files

“3 个文件”,上面写着 - quoderat Demonstrandum。

如您所见,Windows 并不是整个世界。但是,如果您将该存档复制到 Windows 机器并在那里解压缩,它只会将一个文件写入具有 NTFS 或 FAT 文件系统的磁盘 - 这是一个运气问题。如果这三个文件的内容不同,那就太糟糕了。

<小时/>

更新 2: 好的,由于上面详细解释的原因,TrueZIP 中没有解决方案,但如果您想解决它,您可以像这样手动执行:

package de.scrum_master.app;

import de.schlichtherle.truezip.nio.file.TPath;

import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Files;

public class Application {
public static void main(String[] args) throws IOException, URISyntaxException {
TPathHelper tPathHelper = new TPathHelper(
new TPath(
"../../../downloads/powershellarsenal-master.zip/" +
"PowerShellArsenal-master\\LIB/CAPSTONE\\LIB\\X64\\LIBCAPSTONE.DLL"
)
);
TPath caseSensitivePath = tPathHelper.getCaseSensitivePath();
System.out.printf("Original path: %s%n", tPathHelper.getOriginalPath());
System.out.printf("Case-sensitive path: %s%n", caseSensitivePath);
System.out.printf("File size: %,d bytes%n", Files.readAllBytes(caseSensitivePath).length);
}
}
package de.scrum_master.app;

import de.schlichtherle.truezip.file.TFile;
import de.schlichtherle.truezip.nio.file.TPath;

import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Path;

public class TPathHelper {
private final TPath originalPath;
private TPath caseSensitivePath;

public TPathHelper(TPath tPath) {
originalPath = tPath;
}

public TPath getOriginalPath() {
return originalPath;
}

public TPath getCaseSensitivePath() throws IOException, URISyntaxException {
if (caseSensitivePath != null)
return caseSensitivePath;
final TPath absolutePath = new TPath(originalPath.toFile().getCanonicalPath());
TPath matchingPath = absolutePath.getRoot();
for (Path subPath : absolutePath) {
boolean matchFound = false;
for (TFile candidateFile : matchingPath.toFile().listFiles()) {
if (candidateFile.getName().equalsIgnoreCase(subPath.toString())) {
matchFound = true;
matchingPath = new TPath(matchingPath.toString(), candidateFile.getName());
break;
}
}
if (!matchFound)
throw new IOException("element '" + subPath + "' not found in '" + matchingPath + "'");
}
caseSensitivePath = matchingPath;
return caseSensitivePath;
}
}

当然,这有点难看,如果存档中有多个不区分大小写的匹配项,它只会为您提供第一个匹配路径。该算法将在每个子目录中第一个匹配后停止搜索。我对这个解决方案并不特别自豪,但这是一个很好的练习,而且您似乎坚持要这样做。我只是希望您永远不会遇到在区分大小写的文件系统上创建并包含多个可能的匹配项的 UNIX 风格 ZIP 存档。

顺便说一句,我的示例文件的控制台日志如下所示:

Original path: ..\..\..\downloads\powershellarsenal-master.zip\PowerShellArsenal-master\LIB\CAPSTONE\LIB\X64\LIBCAPSTONE.DLL
Case-sensitive path: C:\Users\Alexander\Downloads\PowerShellArsenal-master.zip\PowerShellArsenal-master\Lib\Capstone\lib\x64\libcapstone.dll
File size: 3.629.294 bytes

关于java - TPath 访问文件时忽略大小写 [Java TrueZip],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42879170/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com