- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我必须编写一个正则表达式来限制输入字段,该字段仅允许越南字符,英语字符和数字。我知道如何限制英语字符([a-zA-Z]
)和数字([0-9]
),但不知道如何限制越南字符。
谁能给我一个Java正则表达式来匹配越南字符?
越南字符就像:ể,ứ(编辑:但是我不全都知道。否则,我可以使用[a-list-of-chars]
,或者可能有一个范围,例如[a-d]
而不是[abcd]
)
最佳答案
越南字母
越南语字母和英语字母的交集(即两个字母之间的共同点)是英文减去f
,j
,w
和z
的字母。
在越南语中,a
,e
,i
,o
,u
,y
被视为元音。
除此之外,越南语还使用其他几个带有变音符号的字符。下面列出了字符的大写字母(小写版本具有1字符到1字符的映射,与德语中的ß不同):
Đ: LATIN CAPITAL LETTER D WITH STROKE
Ă: LATIN CAPITAL LETTER A WITH BREVE
Â: LATIN CAPITAL LETTER A WITH CIRCUMFLEX
Ê: LATIN CAPITAL LETTER E WITH CIRCUMFLE
Ô: LATIN CAPITAL LETTER O WITH CIRCUMFLEX
Ơ: LATIN CAPITAL LETTER O WITH HORN
Ư: LATIN CAPITAL LETTER U WITH HORN
á
,严重
à
,钩形
ả
,波浪号
ã
和
ạ
下的点。由于有(6 + 6)个元音乘以5个音调带变音符号,加上6个元音在第一个音调上已经带有变音符,因此有66个带变音符的元音符号:
Á À Ã Ả Ạ
Ă Ắ Ằ Ẳ Ẵ Ặ
 Ấ Ầ Ẩ Ẫ Ậ
Đ
É È Ẻ Ẽ Ẹ
Ê Ế Ề Ể Ễ Ệ
Í Ì Ỉ Ĩ Ị
Ô Ố Ồ Ổ Ỗ Ộ
Ơ Ớ Ờ Ở Ỡ Ợ
Ó Ò Õ Ỏ Ọ
Ư Ứ Ừ Ử Ữ Ự
Ú Ù Ủ Ũ Ụ
Ý Ỳ Ỷ Ỹ Ỵ
String VIETNAMESE_DIACRITIC_CHARACTERS = "ẮẰẲẴẶĂẤẦẨẪẬÂÁÀÃẢẠĐẾỀỂỄỆÊÉÈẺẼẸÍÌỈĨỊỐỒỔỖỘÔỚỜỞỠỢƠÓÒÕỎỌỨỪỬỮỰƯÚÙỦŨỤÝỲỶỸỴ";
for (char c: VIETNAMESE_DIACRITIC_CHARACTERS.toCharArray()) {
System.out.println(c + ": " + Character.getName(c));
}
ợ
(U + 1EE3),可以有几种方法来指定它:
ợ
ơ
(U + 01A1)和下面的点(U + 0323)的组合(2个代码点):ợ
o
的组合,组合钩子(U + 031B)和下面的组合点(U + 0323)(3个代码点):ợ
["ợ","ợ","ợ"].forEach(function (e) {console.log(e.length);})
ợ
,而无需进行任何转换,因此无法将
ợ
和
ợ
比较为相等。
"ợ".equals("ợ") --> false
ợ
指定为规范等效的所有3种方式,并且还定义了用于标准化字符串以进行比较的方法。
Pattern
类的参考实现(由Oracle,在Windows和其他平台上广泛使用)具有(部分)支持使用
Pattern.CANON_EQ
模式的规范对等匹配。从
this和
this错误报告中可以看出,它具有极高的错误性,无法使用。在撰写本文时,由于
CANON_EQ
是“受支持的”,因此所有版本上都存在此错误,并且不可能在短期内得到修复。但是,它并没有被完全破坏,我们仍然可以使用该选件当前提供的任何功能。
Pattern
的构造:
String VIETNAMESE_DIACRITIC_CHARACTERS
= "ẮẰẲẴẶĂẤẦẨẪẬÂÁÀÃẢẠĐẾỀỂỄỆÊÉÈẺẼẸÍÌỈĨỊỐỒỔỖỘÔỚỜỞỠỢƠÓÒÕỎỌỨỪỬỮỰƯÚÙỦŨỤÝỲỶỸỴ";
Pattern p =
Pattern.compile("(?:[" + VIETNAMESE_DIACRITIC_CHARACTERS + "]|[A-Z])++",
Pattern.CANON_EQ |
Pattern.CASE_INSENSITIVE |
Pattern.UNICODE_CASE);
Pattern.CASE_INSENSITIVE | Pattern.UNICODE_CASE
用于使模式对所有Unicode字符不区分大小写。仅
Pattern.CASE_INSENSITIVE
仅会使模式与US-ASCII字符集中的字符区分大小写,不区分大小写。
VIETNAMESE_DIACRITIC_CHARACTERS
中的字符顺序很重要。我不建议您更改字符的顺序,除非您理解其中的含义。
Bạn chính là tác giả của Wikipedia Mọi người đều có thể biên tập bài ngay lập tức chỉ cần nhớ vài quy tắc Có sẵn rất nhiều trang trợ giúp như tạo bài sửa bài hay tải ảnh Bạn cũng đừng ngại đặt câu hỏi Hiện chúng ta có bài viết và thành viên
Bạn chính là tác giả của Wikipedia Mọi người đều có thể biên tập bài ngay lập tức chỉ cần nhớ vài quy tắc Có sẵn rất nhiều trang trợ giúp như tạo bài sửa bài hay tải ảnh Bạn cũng đừng ngại đặt câu hỏi Hiện chúng ta có bài viết và thành viên
String VIETNAMESE_DIACRITIC_CHARACTERS
= "ẮẰẲẴẶĂẤẦẨẪẬÂÁÀÃẢẠĐẾỀỂỄỆÊÉÈẺẼẸÍÌỈĨỊỐỒỔỖỘÔỚỜỞỠỢƠÓÒÕỎỌỨỪỬỮỰƯÚÙỦŨỤÝỲỶỸỴ";
Pattern p =
Pattern.compile("[A-Z" + VIETNAMESE_DIACRITIC_CHARACTERS + "]++",
Pattern.CANON_EQ |
Pattern.CASE_INSENSITIVE |
Pattern.UNICODE_CASE);
A-Z
包含在单个字符类中,而不是将其放在单独的字符类中并与变音符号类交替出现?
Ba n chi nh la ta c gia cu a Wikipedia Mo i ngu o i đe u co the bie n ta p ba i ngay la p tu c chi ca n nho va i quy ta c Co sa n ra t nhie u trang tro giu p nhu ta o ba i su a ba i hay ta i a nh Ba n cu ng đu ng nga i đa t ca u ho i Hie n chu ng ta co ba i vie t va tha nh vie n
String VIETNAMESE_DIACRITIC_CHARACTERS
= "ÁÀÃẢẠĂẮẰẲẴẶÂẤẦẨẪẬĐÉÈẺẼẸÊẾỀỂỄỆÍÌỈĨỊÓÒÕỎỌÔỐỒỔỖỘƠỚỜỞỠỢÚÙỦŨỤƯỨỪỬỮỰÝỲỶỸỴ";
Pattern p =
Pattern.compile("(?:[" + VIETNAMESE_DIACRITIC_CHARACTERS + "]|[A-Z])++",
Pattern.CANON_EQ |
Pattern.CASE_INSENSITIVE |
Pattern.UNICODE_CASE);
Bạn chính là tác giả của Wikipedia Mọi ngươ i đê u có thê biên tạ p bài ngay lạ p tư c chỉ câ n nhơ vài quy tă c Có să n râ t nhiê u trang trơ giúp như tạo bài sư a bài hay tải ảnh Bạn cũng đư ng ngại đạ t câu hỏi Hiẹ n chúng ta có bài viê t và thành viên
Pattern.CANON_EQ
模式,这些字符可以在规范分解下扩展为多个字符并执行正则表达式的文本转换。然后,将按照常规编译表达式。
Pattern
,则
(
类在转换后会吐出该正则表达式。因此,我们只需在末尾添加
(
即可触发
PatternSyntaxException
并查看转换后的正则表达式字符串。
java.util.regex.PatternSyntaxException: Unclosed group near index 596
(?:(?:[Đ]|Ắ|Ắ|Ắ|Ằ|Ằ|Ằ|Ẳ|Ẳ|Ẳ|Ẵ|Ẵ|Ẵ|Ặ|Ặ|Ặ|Ặ|Ặ|Ặ|Ă|Ă|Ấ|Ấ|Ấ|Ầ|Ầ|Ầ|Ẩ|Ẩ|Ẩ|Ẫ|Ẫ|Ẫ|Ậ|Ậ|Ậ|Ậ|Ậ|Ậ|Â|Â|Á|Á|À|À|Ã|Ã|Ả|Ả|Ạ|Ạ|Ế|Ế|Ế|Ề|Ề|Ề|Ể|Ể|Ể|Ễ|Ễ|Ễ|Ệ|Ệ|Ệ|Ệ|Ệ|Ệ|Ê|Ê|É|É|È|È|Ẻ|Ẻ|Ẽ|Ẽ|Ẹ|Ẹ|Í|Í|Ì|Ì|Ỉ|Ỉ|Ĩ|Ĩ|Ị|Ị|Ố|Ố|Ố|Ồ|Ồ|Ồ|Ổ|Ổ|Ổ|Ỗ|Ỗ|Ỗ|Ộ|Ộ|Ộ|Ộ|Ộ|Ộ|Ô|Ô|Ớ|Ớ|Ớ|Ớ|Ớ|Ớ|Ờ|Ờ|Ờ|Ờ|Ờ|Ờ|Ở|Ở|Ở|Ở|Ở|Ở|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ợ|Ợ|Ợ|Ợ|Ợ|Ợ|Ơ|Ơ|Ó|Ó|Ò|Ò|Õ|Õ|Ỏ|Ỏ|Ọ|Ọ|Ứ|Ứ|Ứ|Ứ|Ứ|Ứ|Ừ|Ừ|Ừ|Ừ|Ừ|Ừ|Ử|Ử|Ử|Ử|Ử|Ử|Ữ|Ữ|Ữ|Ữ|Ữ|Ữ|Ự|Ự|Ự|Ự|Ự|Ự|Ư|Ư|Ú|Ú|Ù|Ù|Ủ|Ủ|Ũ|Ũ|Ụ|Ụ|Ý|Ý|Ỳ|Ỳ|Ỷ|Ỷ|Ỹ|Ỹ|Ỵ|Ỵ)|[A-Z])++(
^
( ? : ( ? : [ Đ ] | A ̆ ́ | Ă ́ | Ắ | A ̆ ̀ | Ă ̀ | Ằ | A ̆ ̉ | Ă ̉ | Ẳ | A ̆ ̃ | Ă ̃ | Ẵ | A ̣ ̆ | Ạ ̆ | Ặ | A ̆ ̣ | Ă ̣ | Ặ | A ̆ | Ă | A ̂ ́ | Â ́ | Ấ | A ̂ ̀ | Â ̀ | Ầ | A ̂ ̉ | Â ̉ | Ẩ | A ̂ ̃ | Â ̃ | Ẫ | A ̣ ̂ | Ạ ̂ | Ậ | A ̂ ̣ | Â ̣ | Ậ | A ̂ | Â | A ́ | Á | A ̀ | À | A ̃ | Ã | A ̉ | Ả | A ̣ | Ạ | E ̂ ́ | Ê ́ | Ế | E ̂ ̀ | Ê ̀ | Ề | E ̂ ̉ | Ê ̉ | Ể | E ̂ ̃ | Ê ̃ | Ễ | E ̣ ̂ | Ẹ ̂ | Ệ | E ̂ ̣ | Ê ̣ | Ệ | E ̂ | Ê | E ́ | É | E ̀ | È | E ̉ | Ẻ | E ̃ | Ẽ | E ̣ | Ẹ | I ́ | Í | I ̀ | Ì | I ̉ | Ỉ | I ̃ | Ĩ | I ̣ | Ị | O ̂ ́ | Ô ́ | Ố | O ̂ ̀ | Ô ̀ | Ồ | O ̂ ̉ | Ô ̉ | Ổ | O ̂ ̃ | Ô ̃ | Ỗ | O ̣ ̂ | Ọ ̂ | Ộ | O ̂ ̣ | Ô ̣ | Ộ | O ̂ | Ô | O ̛ ́ | Ơ ́ | Ớ | O ́ ̛ | Ó ̛ | Ớ | O ̛ ̀ | Ơ ̀ | Ờ | O ̀ ̛ | Ò ̛ | Ờ | O ̛ ̉ | Ơ ̉ | Ở | O ̉ ̛ | Ỏ ̛ | Ở | O ̛ ̃ | Ơ ̃ | Ỡ | O ̃ ̛ | Õ ̛ | Ỡ | O ̛ ̣ | Ơ ̣ | Ợ | O ̣ ̛ | Ọ ̛ | Ợ | O ̛ | Ơ | O ́ | Ó | O ̀ | Ò | O ̃ | Õ | O ̉ | Ỏ | O ̣ | Ọ | U ̛ ́ | Ư ́ | Ứ | U ́ ̛ | Ú ̛ | Ứ | U ̛ ̀ | Ư ̀ | Ừ | U ̀ ̛ | Ù ̛ | Ừ | U ̛ ̉ | Ư ̉ | Ử | U ̉ ̛ | Ủ ̛ | Ử | U ̛ ̃ | Ư ̃ | Ữ | U ̃ ̛ | Ũ ̛ | Ữ | U ̛ ̣ | Ư ̣ | Ự | U ̣ ̛ | Ụ ̛ | Ự | U ̛ | Ư | U ́ | Ú | U ̀ | Ù | U ̉ | Ủ | U ̃ | Ũ | U ̣ | Ụ | Y ́ | Ý | Y ̀ | Ỳ | Y ̉ | Ỷ | Y ̃ | Ỹ | Y ̣ | Ỵ ) | [ A - Z ] ) + + (
java.util.regex.PatternSyntaxException: Unclosed group near index 596
(?:(?:[Đ]|Á|Á|À|À|Ã|Ã|Ả|Ả|Ạ|Ạ|Ă|Ă|Ắ|Ắ|Ắ|Ằ|Ằ|Ằ|Ẳ|Ẳ|Ẳ|Ẵ|Ẵ|Ẵ|Ặ|Ặ|Ặ|Ặ|Ặ|Ặ|Â|Â|Ấ|Ấ|Ấ|Ầ|Ầ|Ầ|Ẩ|Ẩ|Ẩ|Ẫ|Ẫ|Ẫ|Ậ|Ậ|Ậ|Ậ|Ậ|Ậ|É|É|È|È|Ẻ|Ẻ|Ẽ|Ẽ|Ẹ|Ẹ|Ê|Ê|Ế|Ế|Ế|Ề|Ề|Ề|Ể|Ể|Ể|Ễ|Ễ|Ễ|Ệ|Ệ|Ệ|Ệ|Ệ|Ệ|Í|Í|Ì|Ì|Ỉ|Ỉ|Ĩ|Ĩ|Ị|Ị|Ó|Ó|Ò|Ò|Õ|Õ|Ỏ|Ỏ|Ọ|Ọ|Ô|Ô|Ố|Ố|Ố|Ồ|Ồ|Ồ|Ổ|Ổ|Ổ|Ỗ|Ỗ|Ỗ|Ộ|Ộ|Ộ|Ộ|Ộ|Ộ|Ơ|Ơ|Ớ|Ớ|Ớ|Ớ|Ớ|Ớ|Ờ|Ờ|Ờ|Ờ|Ờ|Ờ|Ở|Ở|Ở|Ở|Ở|Ở|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ợ|Ợ|Ợ|Ợ|Ợ|Ợ|Ú|Ú|Ù|Ù|Ủ|Ủ|Ũ|Ũ|Ụ|Ụ|Ư|Ư|Ứ|Ứ|Ứ|Ứ|Ứ|Ứ|Ừ|Ừ|Ừ|Ừ|Ừ|Ừ|Ử|Ử|Ử|Ử|Ử|Ử|Ữ|Ữ|Ữ|Ữ|Ữ|Ữ|Ự|Ự|Ự|Ự|Ự|Ự|Ý|Ý|Ỳ|Ỳ|Ỷ|Ỷ|Ỹ|Ỹ|Ỵ|Ỵ)|[A-Z])++(
^
( ? : ( ? : [ Đ ] | A ́ | Á | A ̀ | À | A ̃ | Ã | A ̉ | Ả | A ̣ | Ạ | A ̆ | Ă | A ̆ ́ | Ă ́ | Ắ | A ̆ ̀ | Ă ̀ | Ằ | A ̆ ̉ | Ă ̉ | Ẳ | A ̆ ̃ | Ă ̃ | Ẵ | A ̣ ̆ | Ạ ̆ | Ặ | A ̆ ̣ | Ă ̣ | Ặ | A ̂ | Â | A ̂ ́ | Â ́ | Ấ | A ̂ ̀ | Â ̀ | Ầ | A ̂ ̉ | Â ̉ | Ẩ | A ̂ ̃ | Â ̃ | Ẫ | A ̣ ̂ | Ạ ̂ | Ậ | A ̂ ̣ | Â ̣ | Ậ | E ́ | É | E ̀ | È | E ̉ | Ẻ | E ̃ | Ẽ | E ̣ | Ẹ | E ̂ | Ê | E ̂ ́ | Ê ́ | Ế | E ̂ ̀ | Ê ̀ | Ề | E ̂ ̉ | Ê ̉ | Ể | E ̂ ̃ | Ê ̃ | Ễ | E ̣ ̂ | Ẹ ̂ | Ệ | E ̂ ̣ | Ê ̣ | Ệ | I ́ | Í | I ̀ | Ì | I ̉ | Ỉ | I ̃ | Ĩ | I ̣ | Ị | O ́ | Ó | O ̀ | Ò | O ̃ | Õ | O ̉ | Ỏ | O ̣ | Ọ | O ̂ | Ô | O ̂ ́ | Ô ́ | Ố | O ̂ ̀ | Ô ̀ | Ồ | O ̂ ̉ | Ô ̉ | Ổ | O ̂ ̃ | Ô ̃ | Ỗ | O ̣ ̂ | Ọ ̂ | Ộ | O ̂ ̣ | Ô ̣ | Ộ | O ̛ | Ơ | O ̛ ́ | Ơ ́ | Ớ | O ́ ̛ | Ó ̛ | Ớ | O ̛ ̀ | Ơ ̀ | Ờ | O ̀ ̛ | Ò ̛ | Ờ | O ̛ ̉ | Ơ ̉ | Ở | O ̉ ̛ | Ỏ ̛ | Ở | O ̛ ̃ | Ơ ̃ | Ỡ | O ̃ ̛ | Õ ̛ | Ỡ | O ̛ ̣ | Ơ ̣ | Ợ | O ̣ ̛ | Ọ ̛ | Ợ | U ́ | Ú | U ̀ | Ù | U ̉ | Ủ | U ̃ | Ũ | U ̣ | Ụ | U ̛ | Ư | U ̛ ́ | Ư ́ | Ứ | U ́ ̛ | Ú ̛ | Ứ | U ̛ ̀ | Ư ̀ | Ừ | U ̀ ̛ | Ù ̛ | Ừ | U ̛ ̉ | Ư ̉ | Ử | U ̉ ̛ | Ủ ̛ | Ử | U ̛ ̃ | Ư ̃ | Ữ | U ̃ ̛ | Ũ ̛ | Ữ | U ̛ ̣ | Ư ̣ | Ự | U ̣ ̛ | Ụ ̛ | Ự | Y ́ | Ý | Y ̀ | Ỳ | Y ̉ | Ỷ | Y ̃ | Ỹ | Y ̣ | Ỵ ) | [ A - Z ] ) + + (
A ̂ | Â
在
A ̂ ̀ | Â ̀ | Ầ
之前。这意味着
A ̂
将首先在输入的
Ầ
(
A ̂ ̀
)上尝试,并且在下一次迭代中不匹配任何内容时,重复将结束。
java.util.regex.PatternSyntaxException: Unclosed group near index 589
(?:[A-ZĐ]|Ắ|Ắ|Ắ|Ằ|Ằ|Ằ|Ẳ|Ẳ|Ẳ|Ẵ|Ẵ|Ẵ|Ặ|Ặ|Ặ|Ặ|Ặ|Ặ|Ă|Ă|Ấ|Ấ|Ấ|Ầ|Ầ|Ầ|Ẩ|Ẩ|Ẩ|Ẫ|Ẫ|Ẫ|Ậ|Ậ|Ậ|Ậ|Ậ|Ậ|Â|Â|Á|Á|À|À|Ã|Ã|Ả|Ả|Ạ|Ạ|Ế|Ế|Ế|Ề|Ề|Ề|Ể|Ể|Ể|Ễ|Ễ|Ễ|Ệ|Ệ|Ệ|Ệ|Ệ|Ệ|Ê|Ê|É|É|È|È|Ẻ|Ẻ|Ẽ|Ẽ|Ẹ|Ẹ|Í|Í|Ì|Ì|Ỉ|Ỉ|Ĩ|Ĩ|Ị|Ị|Ố|Ố|Ố|Ồ|Ồ|Ồ|Ổ|Ổ|Ổ|Ỗ|Ỗ|Ỗ|Ộ|Ộ|Ộ|Ộ|Ộ|Ộ|Ô|Ô|Ớ|Ớ|Ớ|Ớ|Ớ|Ớ|Ờ|Ờ|Ờ|Ờ|Ờ|Ờ|Ở|Ở|Ở|Ở|Ở|Ở|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ỡ|Ợ|Ợ|Ợ|Ợ|Ợ|Ợ|Ơ|Ơ|Ó|Ó|Ò|Ò|Õ|Õ|Ỏ|Ỏ|Ọ|Ọ|Ứ|Ứ|Ứ|Ứ|Ứ|Ứ|Ừ|Ừ|Ừ|Ừ|Ừ|Ừ|Ử|Ử|Ử|Ử|Ử|Ử|Ữ|Ữ|Ữ|Ữ|Ữ|Ữ|Ự|Ự|Ự|Ự|Ự|Ự|Ư|Ư|Ú|Ú|Ù|Ù|Ủ|Ủ|Ũ|Ũ|Ụ|Ụ|Ý|Ý|Ỳ|Ỳ|Ỷ|Ỷ|Ỹ|Ỹ|Ỵ|Ỵ)++(
^
[A-Z]
中的元音,从而导致重复在遇到杂散组合标记时尽早终止。
import java.util.regex.*;
import java.text.*;
class Ideone
{
public static void main (String[] args) throws java.lang.Exception
{
String VIETNAMESE_DIACRITIC_CHARACTERS
= "ẮẰẲẴẶĂẤẦẨẪẬÂÁÀÃẢẠĐẾỀỂỄỆÊÉÈẺẼẸÍÌỈĨỊỐỒỔỖỘÔỚỜỞỠỢƠÓÒÕỎỌỨỪỬỮỰƯÚÙỦŨỤÝỲỶỸỴ";
/*
for (char c: VIETNAMESE_DIACRITIC_CHARACTERS.toCharArray()) {
System.out.println(c + ": " + Character.getName(c));
}
*/
String tests[] = new String[3];
tests[0] =
"Bạn chính là tác giả của Wikipedia!\n" +
"Mọi người đều có thể biên tập bài ngay lập tức, chỉ cần nhớ vài quy tắc." +
"Có sẵn rất nhiều trang trợ giúp như tạo bài, sửa bài hay tải ảnh." +
"Bạn cũng đừng ngại đặt câu hỏi.\n" +
"Hiện chúng ta có 1.109.446 bài viết và 406.782 thành viên.";
tests[1] =
Normalizer.normalize(tests[0], Normalizer.Form.NFD);
/*
for (char c: tests[1].toCharArray()) {
System.out.printf("%04x ", (int) c);
}
*/
tests[2] =
Normalizer.normalize(tests[0], Normalizer.Form.NFC);
try {
Pattern p = Pattern.compile("(?:[" + VIETNAMESE_DIACRITIC_CHARACTERS + "]|[A-Z])++", Pattern.CANON_EQ | Pattern.CASE_INSENSITIVE | Pattern.UNICODE_CASE);
for (String t: tests) {
Matcher m = p.matcher(t);
while (m.find()) {
System.out.print(m.group() + " ");
}
System.out.println();
}
} catch (Exception e) {
System.out.println(e);
}
}
}
关于java - Java正则表达式匹配越南字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26543329/
使用sed和/或awk,仅在行包含字符串“ foo”并且行之前和之后的行分别包含字符串“ bar”和“ baz”时,我才希望删除行。 因此,对于此输入: blah blah foo blah bar
例如: S1: "some filename contains few words.txt" S2:“一些文件名包含几个单词 - draft.txt” S3:“一些文件名包含几个单词 - 另一个 dr
我正在尝试处理一些非常困惑的数据。我需要通过样本 ID 合并两个包含不同类型数据的大数据框。问题是一张表的样本 ID 有许多不同的格式,但大多数都包含用于匹配其 ID 中某处所需的 ID 字符串,例如
我想在匹配特定屏幕尺寸时显示特定图像。在这种情况下,对于 Bootstrap ,我使用 col-xx-## 作为我的选择。但似乎它并没有真正按照我认为应该的方式工作。 基本思路,我想显示一种全屏图像,
出于某种原因,这条规则 RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^(.*
我想做类似的东西(Nemerle 语法) def something = match(STT) | 1 with st= "Summ" | 2 with st= "AVG" =>
假设这是我的代码 var str="abc=1234587;abc=19855284;abc=1234587;abc=19855284;abc=1234587;abc=19855284;abc=123
我怎样才能得到这个字符串的数字:'(31.5393701, -82.46235569999999)' 我已经在尝试了,但这离解决方案还很远:) text.match(/\((\d+),(\d+)\)/
如何去除输出中的逗号 (,)?有没有更好的方法从字符串或句子中搜索 url。 alert(" http://www.cnn.com df".match(/https?:\/\/([-\w\.]+
a = ('one', 'two') b = ('ten', 'ten') z = [('four', 'five', 'six'), ('one', 'two', 'twenty')] 我正在尝试
我已经编写了以下代码,我希望用它来查找从第 21 列到另一张表中最后一行的值,并根据这张表中 A 列和另一张表中 B 列中的值将它们返回到这张表床单。 当我使用下面的代码时,我得到一个工作表错误。你能
我在以下结构中有两列 A B 1 49 4922039670 我已经能够评估 =LEN(A1)如2 , =LEFT(B1,2)如49 , 和 =LEFT(B1,LEN(A1)
我有一个文件,其中一行可以以 + 开头, -或 * .在其中一些行之间可以有以字母或数字(一般文本)开头的行(也包含这些字符,但不在第 1 列中!)。 知道这一点,设置匹配和突出显示机制的最简单方法是
我有一个数据字段文件,其中可能包含注释,如下所示: id, data, data, data 101 a, b, c 102 d, e, f 103 g, h, i // has to do with
我有以下模式:/^\/(?P.+)$/匹配:/url . 我的问题是它也匹配 /url/page ,如何忽略/在这个正则表达式中? 该模式应该: 模式匹配:/url 模式不匹配:/url/page 提
我有一个非常庞大且复杂的数据集,其中包含许多对公司的观察。公司的一些观察是多余的,我需要制作一个键来将多余的观察映射到一个单独的观察。然而,判断他们是否真的代表同一家公司的唯一方法是通过各种变量的相似
我有以下 XML A B C 我想查找 if not(exists(//Record/subRecord
我制作了一个正则表达式来验证潜在的比特币地址,现在当我单击报价按钮时,我希望根据正则表达式检查表单中输入的值,但它不起作用。 https://jsfiddle.net/arkqdc8a/5/ var
我有一些 MS Word 文档,我已将其全部内容转移到 SQL 表中。 内容包含多个方括号和大括号,例如 [{a} as at [b],] {c,} {d,} etc 我需要进行检查以确保括号平衡/匹
我正在使用 Node.js 从 XML 文件读取数据。但是当我尝试将文件中的数据与文字进行比较时,它不匹配,即使它看起来相同: const parser: xml2js.Parser = new
我是一名优秀的程序员,十分优秀!