language-agnostic - 特定于语言环境的索引字符-6ren

language-agnostic - 特定于语言环境的索引字符

转载作者：行者123 更新时间：2023-12-04 19:16:40

27

4

我想要一个列表的索引。例如 Android 联系人列表有 #,A-Z。但是对于许多语言环境，这并没有涵盖所有语言环境特定的字符。

不同的编程语言对此的支持如何？我快速浏览了一下，如果是核心 Java，我什么也没看到

有点相关:
http://cldr.unicode.org/development/development-process/design-proposals/index-characters

最佳答案

这个问题问得好!

正如您在 language-agnostic 中所述标签，重要的不是编程语言。这是您真正需要的数据集。我知道没有此类东西的存储库。 ᴄʟᴅʀ 数据还没有包含这个东西。这是一个简单的序列表，用于各种两个字母的 ɪsᴏ 代码，以及一些亚洲序列的附加内容，用 Perl 编写。这种东西可能是模块的基础。

它确实需要一些小心的处理，因为如果你想要一个“大写”-ish 集，你不能盲目地将每个元素中的第一个字素命名为不考虑语言环境。那是因为突厥语 I 的问题。我会安装提取序列的方法，并在他们要求突厥语语言时检测这些东西。

use utf8;
use strict;
use warnings;

our %Alphabet = (
    en => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z)],

    br => [qw(a b ch c'h d e f g h i j k l m n o p r s t u v w y z)],
    cy => [qw(a b c ch d dd e f ff g ng h i l ll m n o p ph r rh s t th u w y)],
    ga => [qw(a á b c d e é f g h i í l m n o ó p r s t u ú)],
    gd => [qw(a b c d e f g h i l m n o p r s t u)],

    la => [qw(a b c d e f g h i k l m n o p q r s t v x y z)],
    it => [qw(a b c d e f g h i k l m n o p q r s t u v z)],
    es => [qw(a b c d e f g h i j k l m n ñ o p q r s t u v w x y z)],
    es__traditional =>
          [qw(a b c ch d e f g h i j k l ll m n ñ o p q r s t u v w x y z)],
    eu => [qw(a b c ch d e f g h i j k l ll m n ñ o p q r s t ts tx tz u v w x y z)],
    rm => [qw(a b c d e f g h i j l m n o p q r s t u v x z)],
    ro => [qw(a ă â b c d e f g h i î j k l m n o p q r s ș t ț u v w x y z)],
    oc => [qw(a b c d e f g h i j l m n o p q r s t u v x z)],

    sw => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z å ä ö)],
    no => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z æ ø å)],
    is => [qw(a á b d ð e é f g h i í j k l m n o ó p r s t u ú v x y ý þ æ ö)],

    cz => [qw(a á b c č d ď e é ě f g h ch i í j k l m n ň o ó p q r ř s š t ť u ú ů v w x y ý z ž)],
    sk => [qw(a á ä b c č d ď dz dž e é f g h ch i í j k l ĺ ľ m n ň o ó ô p q r ŕ s š t ť u ú v w x y ý z ž)],
    sl => [qw(a b c č d e f g h i j k l m n o p r s š t u v z ž)],

    pl => [qw(a ą b c ć d e ę f g h i j k l ł m n ń o ó p r s ś t u w y z ź ż)],

    lt => [qw(a ą b c č d e ę ė f g h i į y j k l m n o p r s š t u ų ū v z ž)],
    lv => [qw(a ā b c č d e ē f g ģ h i ī j k ķ l ļ m n ņ o p r s š t u ū v z ž)],
    et => [qw(a b d e f g h i j k l m n o p r s š z ž t u v õ ä ö ü)],
    et__full =>
          [qw(A B C D E F G H I J K L M N O P Q R S Š Z Ž T U V W Õ Ä Ö Ü X Y)],
    et__simple => [qw(a b d e g h i j k l m n o p r s t u v õ ä ö ü)],

    hu => [qw(a á b c cS d dz dzs e é f g gy H i í j k l ly M n ny O ó ö ő p q r s sz t ty u ú ü ű v w x y z zs)],
    hu__traditional =>
          [qw(a á b c cs d dz dzs e é f g gy h i í j k l ly m n ny o ó ö ő p r s sz t ty u ú ü ű v z zs)],

    tr => [qw(a b c ç d e f g ğ h ı i j k l m n o ö p r s ş t u ü v y z)],
    az => [qw([a b c ç d e ə f g ğ h x ı i j k q l m n o ö p r s ş t u ü v y z)],
    az_1918_1939 =>
        [qw(a в c ç d e ə f g ƣ h i ь j k q l m n o ɵ p r s ş t u v x y z ƶ)],
    az_1939_1958 =>
        [qw(а б в г ғ д е ё ә ж з и й к қ л м н о ө п р с т у ү ф х h ц ч ҷ ш щ ъ ы ь э ю я ')],
    az_1958_1991 =>
        [qw(а б в г ғ д e ә ж з и ы ј к ҝ л м н о ө п р с т у ү ф х һ ч ҹ ш ')],
    az_1991_1992 =>
        [qw(a ä b c ç d e f g ğ h x ı i j k q l m n o ö p r s ş t u ü v y z)],

    he => [qw(α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω)],

    ru => [qw(а б в г д е ж з и к л м н о п р с т у ф х ц ч ш щ ы э ю я)],
    uk => [qw(а б в г ґ д е є ж з и і ї й к л м н о п р с т у ф х ц ч ш щ ь ю я)],
    mk => [qw(а б в г д ѓ е ж з ѕ и ј / к л љ м н њ о п р с т ќ / у ф х ц ч џ ш)],


    "HIRAGANA AIUEO" =>
         [qw(あ い う え お か き く け こ さ し す せ そ た ち つ て と な に ぬ ね の は ひ ふ へ ほ ま み む め も や ゆ よ ら り る れ ろ わ を ん)],
    "KATAKANA AIUEO" =>
         [qw(ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソ タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マ ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ヲ ン)],
    "HALFWIDTH KATAKANA AIUEO" =>
        [qw(ｱ ｲ ｳ ｴ ｵ ｶ ｷ ｸ ｹ ｺ ｻ ｼ ｽ ｾ ｿ ﾀ ﾁ ﾂ ﾃ ﾄ ﾅ ﾆ ﾇ ﾈ ﾉ ﾊ ﾋ ﾌ ﾍ ﾎ ﾏ ﾐ ﾑ ﾒ ﾓ ﾔ ﾕ ﾖ ﾗ ﾘ ﾙ ﾚ ﾛ ﾜ ｦ ﾝ)],
    "KATAKANA IROHA" =>
         [qw(イ ロ ハ ニ ホ ヘ ト チ リ ヌ ル ヲ ワ カ ヨ タ レ ソ ツ ネ ナ ラ ム ウ ヰ ノ オ ク ヤ マ ケ フ コ エ テ ア サ キ ユ メ ミ シ ヱ ヒ モ セ ス)],
    "HIRAGANA IROHA" =>
         [qw(い ろ は に ほ へ と ち り ぬ る を わ か よ た れ そ つ ね な ら む う ゐ の お く や ま け ふ こ え て あ さ き ゆ め み し ゑ ひ も せ す)],
    "HALFWIDTH KATAKANA IROHA" =>
        [qw(ｲ ﾛ ﾊ ﾆ ﾎ ﾍ ﾄ ﾁ ﾘ ﾇ ﾙ ｦ ﾜ ｶ ﾖ ﾀ ﾚ ｿ ﾂ ﾈ ﾅ ﾗ ﾑ ｳ ﾉ ｵ ｸ ﾔ ﾏ ｹ ﾌ ｺ ｴ ﾃ ｱ ｻ ｷ ﾕ ﾒ ﾐ ｼ ﾋ ﾓ ｾ ｽ)],

    "HANGUL CHOSUNG" =>
         [qw(ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅅ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ)],
    "HANGUL GANADA" =>
         [qw(가 나 다 라 마 바 사 아 자 차 카 타 파 하)],
    "CHINESE ZODIAC 10" =>
         [qw(甲 乙 丙 丁 戊 己 庚 辛 壬 癸)],
    "CHINESE ZODIAC 12" =>
         [qw(子 丑 寅 卯 辰 巳 午 未 申 酉 戍 亥)],

    "ZODIAC" => [qw(♈ ♉ ♊ ♋  ♌  ♍  ♎  ♏  ♐  ♑  ♒  ♓  )],

);

for my $a (\%Alphabet) {

    $$a{da} = $$a{no};
    $$a{fi} = $$a{no};

    $$a{de} = $$a{en};
    $$a{fr} = $$a{en};
    $$a{pt} = $$a{en};
}


1;

不过，这当然足以让您入门。

关于language-agnostic - 特定于语言环境的索引字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8656671/

27

4

0

文章推荐： php - 什么会导致 unlink 返回 'Resource Temporarily Unavailable' ？

文章推荐： apache - 为什么apache虚拟服务器没有运行

文章推荐： apache - 没有 http 服务器将提供来 self 的服务器的页面

Grails 环境
我在文档中找不到答案，所以我在这里问。在 Grails 中，当您创建应用程序时，您会默认获得生产、开发等环境。如果您想为生产构建 WAR，您可以运行以下任一命令: grails war 或者 gr
Sitecore 环境
我们组织的网站正在迁移到 Sitecore CMS，但我们正在努力以某种方式为开发人员 (4)、设计师 (4)、QA 人员 (3)、作者 (10-15) 和批准者 (4-10) 设置环境在他们可以独立
CVSROOT 环境
如何在WinCVS中设置CVSROOT环境变量？最佳答案简单的回答是:您不需要。 CVSROOT 环境变量被高估了。 CVS(NT) 只会在确定存储库连接字符串的所有其他方法都已用尽时才使用它。人
haskell 环境
我最近完成了“learnyouahaskell”一书，现在我想通过构建 yesod 应用程序来应用我所学到的知识。但是我不确定如何开始。关于如何设置 yesod 项目似乎有两个选项。一是Stack
C# 环境
在这一章中，我们将讨论创建 C# 编程所需的工具。我们已经提到 C# 是 .Net 框架的一部分，且用于编写 .Net 应用程序。因此，在讨论运行 C# 程序的可用工具之前，让我们先了解一下 C#
03、Ruby 环境
运行Ruby 代码需要配置 Ruby 编程语言的环境。本章我们会学习到如何在各个平台上配置安装 Ruby 环境。各个平台上安装 Ruby 环境 Linux/Unix 上的 Ruby 安装
ide - 最佳移动应用程序开发工具/环境？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
r - 返回和保存时如何清理函数闭包(环境)？
我有一个这样的计算(请注意，这只是非常简化的、缩减版的、最小的可重现示例!): computation <- function() # simplified version! { # a lo
R 环境/哈希表随着增长到数百万而变慢
我使用环境作为哈希表。键是来自常规文本文档的单词，值是单个整数(某个其他结构的索引)。当我加载数百万个元素时，更新和查找都变慢了。下面是一些代码来显示行为。看起来从一开始的行为在 O(n) 中比在
可重现的 saveRDS 环境
我正在构建一个 R 包并使用 data-raw和 data存储预定义的库 RxODE楷模。这非常有效。然而，由此产生的.rda文件每代都在变化。某些模型包含 R 环境，并且序列化似乎包含“创建时间”
Xcode 环境——快捷方式和缩进实用程序
(不确定问题是否属于这里，所以道歉是为了) 我很喜欢 Sublime Text ，我经常发现 Xcode 缺少一些文本/数据处理的东西。我可能有不止一个问题—— 'Command +/' 注释代码但没
Symfony - 仅在开发中定义路线。环境
我正在使用 SF2，并且创建了一些有助于项目调试的路由: widget_debug_page: path: /debug/widget/{widgetName} defau
django - conda 环境
我创建了一个名为 MyDjangoEnv 的 conda 环境。当我尝试使用 source activate MyDjangoEnv 激活它时，出现错误: No such file or direct
javascript - Cordova 环境
有没有办法区分从本地机器运行的包和从 Cordova 应用商店安装的包？例如，我想像这样设置一个名为“evn”的 JavaScript 变量: if(cordovaLocal){ env = 'de
足够困难地学习的 C 环境
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
Java 初学者网络开发工具包/环境
我的任务是使用 java 和 mysql 开发一个交互式网站:使用 servlet 检索和处理数据，applet 对数据客户端进行特殊处理，并处理客户端对不同数据 View 的请求。对于使用 jav
Linux 环境 -i 奇怪
这按预期工作: [dgorur@ted ~]$ env -i env [dgorur@ted ~]$ 这样做: [dgorur@ted ~]$ env -i which date which: no
R:列表中的快速哈希搜索(环境)
我想进行非常快速的搜索，看来使用哈希(通过环境)是最好的方法。现在，我得到了一个在环境中运行的示例，但它没有返回我需要的内容。这是一个例子: a system.time(benchEnv(), g
Windows 环境 OpenACC
我想开始开发 OpenACC 程序，我有几个问题要问:是否可以在 AMD gpu 上执行 OpenACC 代码？如果是这样，我正在寻找适用于 Windows 环境的编译器。我花了将近一个小时什么也没
Linux 环境。让机器变慢
这可能看起来很奇怪，但是有没有办法制作机器(linux/unix 风格 - 最好是 RHEL)。我需要控制机器的速度以确保代码在非常慢的系统上工作并确定正确的断点(在时间方面)。我能做到的一种方法是

首页

博学

6Ren·AI

商城

language-agnostic - 特定于语言环境的索引字符