java - 适用于 Latin-1 字符的不区分大小写的索引-6ren

java - 适用于 Latin-1 字符的不区分大小写的索引

转载作者：太空宇宙更新时间：2023-11-04 14:30:45

25

4

我正在寻找一种通过以下测试用例的方法:

 assertEquals(0, indexOfIgnoreCase("ss", "ß"));
 assertEquals(0, indexOfIgnoreCase("ß", "ss"));
 assertEquals(1, indexOfIgnoreCase("ßa", "a"));

有趣的字符(称为德语“sharp S”)并不是真正的异国情调(U+00DF，存在于 Latin-1 Suplement Unicode block 中)，除非您将其大写:"ß".toUpperCase() 返回 "SS"(与区域设置无关)。

我寻找至少适用于前 256 个 Unicode 字符的解决方案，除了 ICU4j 之外什么也没返回，我不想使用它。

This question (间接)要求 String.contains 不区分大小写的版本，但请注意，大多数答案仅适用于 ASCII。接受的答案可以进行调整，例如

final int flags = Pattern.CASE_INSENSITIVE | Pattern.UNICODE_CASE;
Pattern pattern = Pattern.compile(Pattern.quote(needle), flags);
final Matcher matcher = pattern.matcher(hay);
return matcher.find() ? matcher.start() : -1;

因此它也适用于非 ASCII 并返回位置而不是 boolean 值。然而，它未能通过上述测试。

Apache org.apache.commons.lang3.StringUtils 也没有通过。这个nice answer利用 String.regionMatches 提供了快速解决方案，但没有通过。

转换为小写是不够的，转换为大写就可以了，但最后一个测试用例将返回 2 而不是 1。

<小时/>

我有点不确定结果是什么

indexOfIgnoreCase("ßa", "sa")

应该是？ 0.5 作为“针”从 ß 大写的第二个 S 开始？

最佳答案

将原始文本和needle转换为字符数组
将每个字符转换为大写
查找原始文本数组中的needle子数组位置。

例如:

char[] text = convertToUpperCase("...".toCharArray());
char[] needle = convertToUpperCase("...".toCharArray());

for (int i = 0; i < text.length - needle.length; i++)
    if (arraysEqual(needle, 0, text, i, needle.length)) // The same signature as System.arraycopy
        return i;

return -1;

关于java - 适用于 Latin-1 字符的不区分大小写的索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26181647/

25

4

0

文章推荐： java - Jenkins Jelly 更新文本框

文章推荐： html - 垂直导航菜单不会悬停

文章推荐： java - JFace 数据绑定(bind)发生在其他事件之后

c - 大小写
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用，以及预
忽略 CSS 大小写
出于某种原因，右栏中的精选文章忽略了“#elementtext”和“#elementtext:hover”属性。仅显示“p.element”和“img.element”。有什么想法吗？谢谢 - 塔
python - 多个枚举值的开关/大小写
我有两个值，每个值都来自不同的枚举。我想检查这两者的允许组合，如果没有找到则执行默认操作。我能以某种方式对这两个值进行切换/大小写吗？我想避免使用多个 if/else 语句或遵循位掩码模式的枚举，只是
javascript - 如何制作 `where not` 大小写？
我需要 where 但 not 大小写。例如，我想找到没有名字“莎士比亚”的戏剧: _.where(listOfPlays, {author: !"Shakespeare", year: 1611})
SQLITE 更新、限制、大小写
我想实现一个 parking 场应用所以有一个带5个或更多 parking 位的车库当司机 parking 时，车库中的下一个空闲位置应该分配给他。所以我有一个带 5 个或更多插槽的 table 上
Erlang 切换(大小写)整除性
我想使用 Erlang 来确定传递给函数的变量是否可以被数字整除。我考虑过使用 case 来执行此操作，但是我找不到解决方案。 case 是适合这项工作的工具吗？示例:将数字传递给函数 f()。如果
php - 将表中的列名称显示为 Pascal 大小写
我在 phpmyadmin 中创建了一个表，其列名如 first_name、last_name。当我使用命令显示表中的列名时，它会将它们显示为 first_name。我想显示我的列名称，如 Firs
swift - 将字符串格式化为 Pascal 大小写
使用 Swift 4，如何使用这些规则格式化字符串: 如果单词超过 3 个字母，则首字母大写，否则大写包含像 St-Michel 这样的连字符的 Pascal 大小写单词我这里有初稿，但我一直在思
C++ 带字符串参数的 Switch 大小写
这个问题在这里已经有了答案: Why can't the switch statement be applied to strings? (23 个回答) 关闭 8 年前。大家好所以我正在尝试对
html - 获取具有相同名称的多个表单值( bool 大小写)
在 MVC 操作中，我如何访问使用多个同名值提交的“表单数据”中的值？我做了什么:int、decimal、string 类型的值工作完美。问题:每个变体都有一个复选框，所以当我尝试获取它时，它只显
c - 有没有办法检查数组中字符串的大写和 isalpha 大小写？
while(1) { char buff[1000]; printf("Enter the word: "); fgets(buff, 1000
c - DllMain 中没有中断的开关/大小写
我有一个 Dllmain，它在线程附加到此 DLL 时分配线程本地存储。代码如下: BOOL APIENTRY DllMain(HMODULE hModule,
c# - 如何将文本转换为 Pascal 大小写？
我有一个变量名，比如“WARD_VS_VITAL_SIGNS”，我想将它转换为 Pascal 大小写格式:“WardVsVitalSigns” WARD_VS_VITAL_SIGNS -> WardV
swift - SKAudioNode else/if off/on 大小写
我是 Swift 编码的新手，正在尝试弄清楚如何在触摸节点时制作具有开/关功能的循环音频。我认为实现它的最佳方式是通过 SKAudioNode，但我不确定我在以下代码中做错了什么。当在节点上按下时 -
带有类的枚举上的 Swift Switch 大小写
这是我第一次使用这种枚举，具有关联值类型的枚举，我需要根据对象的类型制作一个 switch 语句，我无法做到，这是枚举: enum TypeEnum { case foo(FooClass)
c# - 将字符串中的字符替换为行中下一个的大写字母(Pascal 大小写)
我想从字符串中删除所有下划线，下划线后面的字符为大写。因此，例如:_my_string_ 变为:MyString 同样:my_string 变为 MyString 有没有更简单的方法呢？我目前有以下内
java - 在Java中将字符串从蛇大小写转换为 Camel 大小写
如何在 Java 中将蛇形大小写转换为 Camel 形大小写？输入:“input_in_snake_case” 输出:“InputInSnakeCase” 最佳答案 Guava通过其CaseForm
thinkphp 表名大小写窍门
我们有一个表auth_group_access，那么如何使用呢？在使用M方法时，对于带下划线的表名，可以采用如下方法。 M('AuthGroupAccess'); 对应sql语句SQL: S
dictionary - 使用字典键和值的 Python 匹配/大小写
我正在制作一个 pygame 游戏，每当我运行我的代码时，我都会收到错误 expected ':'。我知道在 match/case block 中使用 [ 和 ] 用于其他用途，但我该如何解决这个问题
regex - Notepad++ 正则表达式用于降低 URL 大小写
有人能告诉我是否可以使用正则表达式将 url 转换为小写？这是在 html img 标签内，所以我们可以通过标签找到网址。这是我所拥有的一个例子我需要在最后小写图像名称。该文档包含更多 H

首页

博学

6Ren·AI

商城

java - 适用于 Latin-1 字符的不区分大小写的索引