gpt4 book ai didi

Java用多个分隔符分割一个字符串,其中一些是2个字符的序列

转载 作者:行者123 更新时间:2023-11-30 08:34:48 33 4
gpt4 key购买 nike

这里的长期读者,但第一次海报!我正在从事一个大学项目,该项目涉及使用 Java 来处理以基于文本的 abc 符号标准编写的传统音乐旋律的转录(如果您有兴趣,请参阅 here 以获取有关 abc 标准的快速解释)。

我想获取表示为字符串的整个曲调转录的主体,并将其拆分为单独的小节(即分成一组字符串,每个小节一个字符串)。 abc 标准有许多不同的 symbols and combinations of symbols用于分隔栏的。这些符号是:

|   
|]
||
[|
|:
:|
::

我的想法是使用正则表达式和 String.split() 方法将下面的 tuneBody 字符串分解为 arrayOfBars 字符串数组。我的正则表达式在下面,旨在尝试找到上述任何可用于分隔音乐中小节的符号。

import java.util.Arrays;

public class TroubleshootRegex
{
//Split the tuneBody into individual bars
public static void main(String[] args)
{
//The musical notes from an abc tune transcription
String tuneBody = "|:G3 GAB|A3 ABd|edd gdd|edB dBA|\nGAG GAB|ABA ABd|edd gdd|BAF G3:|\nB2B d2d|ege dBA|B2B dBG|ABA AGA|\nBAB d^cd|ege dBd|gfg aga|bgg g3:|";

//The body of the tune after being split into individual bars
String[] arrayOfBars;

//This regex is my attempt to look for all the possible bar delimiters defined in the abc standard
String abcBarDelimiters = "[\\|]|\\|\\||\\[\\||\\|:|:\\||::|\\|]";
arrayOfBars = tuneBody.split(abcBarDelimiters);
System.out.println(Arrays.toString(arrayOfBars));
}
}

不幸的是,当我运行上面的代码时,我遇到了几个问题。其中一个问题是我在数组的开头得到一个空字符串,但一些研究表明这是一个已知问题,所以我会想办法解决这个问题。更大的问题虽然我自己似乎无法弄清楚,但我最终在音乐的第一小节中包含了一个冒号,而这个应该作为音乐的一部分被过滤掉如果一切按预期进行,则拆分字符串时的初始定界符。即我希望在字符串拆分期间删除 tuneBody 中的初始“|:”分隔符。这是输出:

[, :G3 GAB, A3 ABd, edd gdd, edB dBA,   
GAG GAB, ABA ABd, edd gdd, BAF G3,
B2B d2d, ege dBA, B2B dBG, ABA AGA,
BAB d^cd, ege dBd, gfg aga, bgg g3]

我假设这意味着我的正则表达式中可能有某种问题,但就我的生活而言,我似乎无法弄清楚实际问题是什么,我开始交叉 -眼睛看着呢!好像是匹配开头的单竖线字符作为分隔符,而不是匹配字符序列 |:

如果任何真正了解正则表达式的人能告诉我为什么我的正则表达式似乎不符合我的要求,或者如何让它看到整个 |: 序列作为分隔符,我将不胜感激, 而不是定界符后跟冒号。

提前致谢!

最佳答案

One of the issues is that I get an empty string at the start of the array, but a bit of research shows me that that's a known issue so I'll figure out a way to work around that.

问题在于您的字符串以定界符开头,因此它将创建一个空字符串作为拆分的第一个元素。如果您有两个连续的定界符,也会发生同样的情况,例如...|::|...。要解决这个问题,您可以删除不需要的空字符串,例如通过使用列表而不是数组。

The bigger issue though that I can't seem to figure out on my own is that I end up with a colon included in the first bar of the music, whereas this should be filtered out as part of the initial delimiter when splitting the string if everything worked as intended. i.e. I want the initial "|:" delimiter from tuneBody to be removed during the string splitting.

我在这里不完全确定(但很确定):问题是单管道是正则表达式中的第一个选项,因此它与 |: 中的管道相匹配。要解决这个问题,将单个管道放在最后就足够了。

您还可以简化正则表达式,因为您不需要字符类。因此这应该有效:

String abcBarDelimiters = "\\|\\||\\[\\||\\|:|:\\||::|\\|\\]|\\|";

关于Java用多个分隔符分割一个字符串,其中一些是2个字符的序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38613100/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com