- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
"igsc"。 当我使用 toLowerCase(new Locale("en", "US")) 函-6ren">
我想将包含土耳其语字符的字符串转换为小写,并将土耳其语字符映射为英语等价物,即 "İĞŞÇ"
-> "igsc"
。
当我使用 toLowerCase(new Locale("en", "US"))
函数时,它会将例如 ©
转换为 i
但是点缀。
我该如何解决这个问题? (我正在使用 Java 7)
谢谢。
最佳答案
你可以
1) 首先,删除重音符:
以下内容来自本主题:
Is there a way to get rid of accents and convert a whole string to regular letters? :
Use java.text.Normalizer to handle this for you.
string = Normalizer.normalize(string, Normalizer.Form.NFD);
This will separate all of the accent marks from the characters. Then, you just need to compare each character against being a letter and throw out the ones that aren't.
string = string.replaceAll("[^\\p{ASCII}]", "");
If your text is in unicode, you should use this instead:
string = string.replaceAll("\\p{M}", "");
For unicode, \P{M} matches the base glyph and \p{M} (lowercase) matches each accent.
2) 然后,把剩下的String
转为小写
string = string.toLowerCase();
关于java - 将包含土耳其语字符的字符串转换为小写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35597603/
2016 年土耳其政府决定保留 GMT+3 时区以节省夏令时,但在 Android 上: Calendar calendar = Calendar.getInstance(); TimeZone tz
浏览器上 JavaScript 中的日期计算问题。有 3 个参数 -从日期、天数和到日期 从使用 JavaScript 中的日历组件选择的日期 = 30/10/2016输入的天数 = 2 基于没有。应
有人可以帮忙解决以下问题吗? 我的操作系统是最新的 windows 10,时区是 (UTC+0300) Istanbul(夏令时已被移除,时区设置为 +0300 在土耳其的最新规定之后 - 2016
我是一名优秀的程序员,十分优秀!