- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我开发此代码是为了解析目录内的图像文件名,有两种类型的文件,照片和图像,因此每种文件都有不同的文件名模式,所以我想出了这种方法,查看文件夹内部并获取所有图像(照片和图像)的列表,然后匹配正确的模式以获得值。
问题是由于某种原因正则表达式模式与文件名不匹配,我已经使用此链接 https://regex101.com/r/cvuEfR/3 检查了语法和模式验证它们。
所以我认为问题出在其他地方,但我不明白。
文件结构和文件如下所示
resource_files
|_Photos
|_1
RD1500-0001-1-P.JPG
RD1500-0001-2-P.JPG
|_2
RD1500-0002-1-P.JPG
RD1500-0002-2-P.JPG
|_Images
|_1
|_extL
R0001A+01.01B+01-extL.JPG
R0001A+01.10B+82-extL.JPG
|_1
|_extR
R0002A+10.10B+23-extL.JPG
R0002A+01.10B+06-extL.JPG
我正在按如下方式解析照片的值
RD1500-0001-1-P.JPG
1500
0001
1
P
对于图像:
R0002A+10.10B+23-extL.JPG
0002
10.10
23
extL
public class ImageNameParser implements IImageNameProcessor {
private static final String PHOTO_PATTERN="([A-Za-z0-9]+)-(\\d\\d\\d\\d)-(\\d)-([A-Za-z]+)";
private Pattern photoPattern = Pattern.compile(PHOTO_PATTERN);
private static final String IMAGE_PATTERN="([A-Za-z0-9]+)(\\d\\d\\d\\d)([A-Za-z0-9]+)[\\+](\\d\\d.\\d\\d)([A-Za-z0-9]+)[\\+](\\d\\d)-([A-Za-z0-9]+)";
private Pattern imagePattern = Pattern.compile(IMAGE_PATTERN);
private ImageHierarchy extractType1Info(File imageFile,String tag,String group) throws Exception {
if (imageFile!=null && imageFile.isFile()) {
Matcher m = imagePattern.matcher(imageFile.getName());
if (m.find()) {
/* m.group(1) -
m.group(2) - SubGroup
m.group(3) -
m.group(4) - ValueA
m.group(5) -
m.group(6) - ValueB
m.group(7) - SubType
*/
ImageHierarchy imageData = new ImageHierarchy(imageFile.getName(), imageFile.getAbsolutePath(), m.group(2), tag, group);
imageData.addImageParameters(m.group(4), m.group(6),m.group(7), null, null);
return imageData;
} else {
return null;
}
} else {
return null;
}
}
private ImageHierarchy extractType2Info(File imageFile,String tag,String group) {
if (imageFile!=null && imageFile.isFile()) {
Matcher patternMatcher = photoPattern.matcher(imageFile.getName());
if (patternMatcher.find()) {
/*
patternMatcher.group(1) - Group
patternMatcher.group(2) - SubGroup
patternMatcher.group(3) - SequenceNumber
patternMatcher.group(4) - PhotoAtribute
*/
ImageHierarchy imageData = new ImageHierarchy(imageFile.getName(), imageFile.getAbsolutePath(), patternMatcher.group(2), tag, patternMatcher.group(1));
imageData.addImageParameters(null, null,null, patternMatcher.group(3), patternMatcher.group(4));
return imageData;
}
}
return null;
}
private File[] getFiles(File folder ,String group, String tag){
ArrayList<File> fileList= new ArrayList<File>();
if(folder!=null)
{
ArrayList<File> directories = new ArrayList<File>();
directories.add(folder);
while(!directories.isEmpty() && (folder = directories.remove(0))!=null) {
File[] listOfFiles = folder.listFiles();
if(listOfFiles!=null)
{
for ( File file : listOfFiles) {
if(file.isFile()){
if((group!=null && file.getName().contains(group)) || (tag!=null && file.getName().contains(tag))){
System.out.println(file.getName());
fileList.add(file);
}
} else if(file.isDirectory()){
directories.add(file);
}
}
}
}
}
return fileList.toArray(new File[]{});
}
public ProcessedImages process(File folder ,String group,String tag) throws Exception{
ImageHierarchy imageInfo = null;
ProcessedImages collection = new ProcessedImages();
File[] imageFiles = getFiles(folder, group, tag);
for (File imageFile : imageFiles) {
imageInfo = extractType1Info(imageFile, tag, group);
if(imageInfo!=null)
{
collection.AddImage(imageInfo);
}
else
{
imageInfo = extractType2Info(imageFile,tag, group);
if(imageInfo!=null)
{
collection.AddImage(imageInfo);
}
}
}
return collection;
}
}
最佳答案
我的猜测是,也许您可能会尝试编写一些带有选项的表达式,例如:
^[A-Za-z]{1,2}(\d{4})[A-Z]?([+-]\d{2}\.?\d{2})[A-Z]?([+-][0-9]+)-([A-Za-z]+)
也许不是,我不太确定。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class re{
public static void main(String[] args){
final String regex = "^[A-Za-z]{1,2}(\\d{4})[A-Z]?([+-]\\d{2}\\.?\\d{2})[A-Z]?([+-][0-9]+)-([A-Za-z]+)";
final String string = "A0001L+23.20K+01-Red.JPG\n"
+ "R0002A+10.10B+23-extL.JPG\n"
+ "RD1500-0001-1-P.JPG";
final Pattern pattern = Pattern.compile(regex, Pattern.MULTILINE);
final Matcher matcher = pattern.matcher(string);
while (matcher.find()) {
System.out.println("Full match: " + matcher.group(0));
for (int i = 1; i <= matcher.groupCount(); i++) {
System.out.println("Group " + i + ": " + matcher.group(i));
}
}
}
}
Full match: A0001L+23.20K+01-Red
Group 1: 0001
Group 2: +23.20
Group 3: +01
Group 4: Red
Full match: R0002A+10.10B+23-extL
Group 1: 0002
Group 2: +10.10
Group 3: +23
Group 4: extL
Full match: RD1500-0001-1-P
Group 1: 1500
Group 2: -0001
Group 3: -1
Group 4: P
jex.im可视化正则表达式:
<小时/>如果您想简化/修改/探索表达式,regex101.com 的右上角面板已对此进行了解释。 。如果您愿意,也可以在 this link 观看,它如何与一些示例输入相匹配。
<小时/>关于java - 正则表达式模式与目录内的文件名不匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58002703/
任何帮助深表感谢。我正在尝试创建一个 SSIS 包来遍历文件夹中的文件并获取路径+文件名,最后执行存储的过程,参数为路径+文件名。我不确定如何获取路径+文件名并将其作为参数插入到存储过程中。我附上了截
我想编写一个小脚本来搜索确切的文件名,而不是文件名中的字符串。 例如,如果我使用资源管理器搜索“主机”,默认情况下我会得到多个结果。对于脚本,我只需要我指定的名称。我假设这可能吗? 我才真正开始编写脚
str(文件.key) = '1011/101011/文件名' newFileName = str(file.key) 但是,当我运行代码时,我得到: UnicodeEncodeError: 'asc
下面这段子程基本上可以算是比较不错的通用匹配了。(PS:我突然发现CODE_LITE把我的UBB转义了!!!晕,我只好自己转义了。。。) Dim objRegExp,Matc
PHP 无法处理带有 Unicode 字符的文件:当我在浏览器上访问 testSite/главная.php 时,它会抛出此错误。 Warning: Unknown: failed to open
我正在尝试包含 Dim在 Vlookup 中。 Dim filename As String filename = Format(DateAdd("d", -6, Now()), "mm-dd-yy"
在我的日常构建项目中,我们将其库存储到其版本名称目录中。 . 对于最新的,我们正在创建符号链接(symbolic link)作为“最新”。 前任。- ls -ltr drw-r--r-- 1 4096
重新安装了 Windows 10(版本 10.0.14393)。重新安装了以下内容: java java version "1.8.0_121" Java(TM) SE Runtime Environ
我想使用 Jekyll 和 GitHub Pages 构建文档站点。问题是 Jekyll 只接受 _posts 下的文件名具有精确的图案,如 YYYY-MM-DD-your-title-is-here
我不知道我发生了什么事。我想访问一个包含多个文件的目录,假设: folder\\1.txt 2.txt 3.txt.... 现在我想根据它们的出现情况来阅读它们,我的意思是首先是最低的,只是我想按升
如何将/放入文件名(即/不分隔路径的组成部分)? 最佳答案 你不知道。 UNIX 文件名中不允许使用斜线。 关于unix - 你如何获得 a/into 文件名?,我们在Stack Overflow上找
我需要复制一个大文件夹,并重命名其中的所有文件和文件夹(如果它们包含特定字符串)。基本上我想复制所有内容并将 10 的任何实例更改为 11。 例如,如果我有一个结构如下的文件夹: mainfolder
我有一个简单的 python (2.7) 脚本,应该执行一些 svn 命令: def getStatusOutput(cmd): print cmd p = subprocess.Po
我正在尝试读取以字符串形式存储在数据文件中的文件名。那里没问题。如果我将它传递给 genfromtxt,我会收到错误“IOError:Z:\Python\Rb input.txt not found”
简单的问题。 当我尝试打开名为 text.txt 的文件时,它可以正常工作。 但是,如果我将文件重命名为 text.cir.txt,则会出现错误。 我可以做什么来修复它? FILE *fd; char
我是 c# 的业余爱好者,我一直无法找到这个问题的答案。也许我不知道要使用的正确术语。 当一个视频文件被拖到我的 exe 应用程序上时,我希望应用程序知道它是用一个文件启动的,并且能够知道该文件的路径
我知道我必须使用 Substring 来删除,但我不知道该怎么做。我需要像这样删除字符串的结尾 来自 "C:\\Users\\myname\\Pictures\\shoeImage.jpg" 到 "C
运行 eclipse 时我收到此错误。但是当我运行我的项目时,它是在内部浏览器中执行的。但它不会在默认的系统浏览器中执行。对此任何一个答案。先谢谢您的回答 最佳答案 您可以从 eclipse 更改浏览
我想要求用户选择一个要从外部存储打开的文件并接收它的路径。最好我想避免过多的编码并使用一些标准方法(众所周知,系统提供的 Intent 或类似方法)。所说的文件是SpatiaLite db文件(*.s
我有一个文件名数据库,我正在尝试使用 PG 的全文搜索工具在其中进行搜索。我在文件名表上运行搜索查询,问题是排名函数没有按照我希望的那样对结果进行排名。为了便于讨论,我们假设架构如下所示: creat
我是一名优秀的程序员,十分优秀!