gpt4 book ai didi

unicode - 为 jruby 1.8.2( native 实现)寻找带有规范化器(NFD、NFKD、NFC、NFKC)的 gem

转载 作者:行者123 更新时间:2023-12-01 04:09:39 26 4
gpt4 key购买 nike

是否有实现 UTF8 规范化器(NFD、NFKD、NFC、NFKC)的 native gem(因此可用于 jruby 1.8.2)?

最佳答案

Ruby v1.8 在 Unicode 上真的很不稳定。我发现 v1.9 是用于理智处理的最小 Ruby 版本。即便如此, unicode_utils gem for v1.9.1 for better是绝对不可缺少的。它具有完整的案例映射和规范化功能。你真的需要它。

不幸的是,它不包括排序规则,所以你不能做alphabetic sorts ruby 您可以使用 Perl 或访问 ICU 库的语言的方式。排序规则是最难正确的,因此丢失它也就不足为奇了。但它很关键,因为它几乎是我们对文本所做的一切的基础。这不仅仅是排序;这是关于简单的字符串比较。大多数人没有意识到这一点。

我在我的 third OSCON talk 中谈到了 Ruby 的 Unicode 支持以及您可以做些什么来让您的生活更轻松一点。从几周前开始。我承认我放弃了 Ruby v1.8;这太令人沮丧了。

这并不是对 Ruby 的打击,因为对于当今大多数不是最新版本的语言来说也是如此。

  • 除非您运行的是 v1.9,否则您不会对 Ruby 和 Unicode 感到满意。
  • 如果你没有运行 Python v3(最好是 v3.2 或者可能是 v3.3)和一个广泛的构建,你会对使用 Unicode 的 Python 感到不满。
  • 如果您没有运行 Java v1.7,那么您会对使用 Unicode 的 Java 感到不快——甚至可能在那时。 :(
  • 如果您没有运行 Perl v5.14 或更高版本,您可能会对使用 Unicode 的 Perl 不满意。

  • 因此,这四个的情况与 PHP、Javascript 和 Go 的情况完全不同。对于后三种语言,你运行什么版本并不重要,因为
  • 对于前两个,您将永远对它们的 Unicode 支持不满意。这真的很糟糕,因为使用它们的人几乎永远无法切换到具有真正 Unicode 支持的真正语言。利基市场过于特殊。
  • 而对于 Go,你永远不会对它的 Unicode 支持感到不满意——除非你很着急:规范化模块已经非常接近准备就绪并且已经出来了,而整理模块正在开发中,但它确实要困难得多.

  • 有什么方法可以让你使用 Ruby v1.9?

    关于unicode - 为 jruby 1.8.2( native 实现)寻找带有规范化器(NFD、NFKD、NFC、NFKC)的 gem,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7061761/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com