gpt4 book ai didi

ruby - 如何在 UTF-8 字符上使用 String 方法?

转载 作者:数据小太阳 更新时间:2023-10-29 08:15:00 28 4
gpt4 key购买 nike

如何在 UTF-8 字符上使用字符串方法?

例如,我有一个包含西里尔字符的字符串,所以当我使用 string.upcase 时它不起作用。

最佳答案

Ruby 只支持字母 AZaz 的大小写转换。

原因很简单,其他字母的大小写转换没有明确定义。例如,土耳其语 'I'.downcase # => 'ı''i'.upcase # => 'İ',但法语 ' I'.downcase # => 'i''i'.upcase # => 'I'。 Ruby 不仅必须知道字符编码,还必须知道正确执行此操作的语言。

更糟的是,用德语

'MASSE'.downcase

要么

'maße'   # "measurements"
'masse' # "mass"

换句话说:您需要真正理解文本,即您需要一个成熟的 AI 才能正确进行大小写转换。

我自己实际上曾经不小心构造了一个句子,即使是人类也是无法判定的。

简而言之:完全不可能正确执行,这就是为什么 Ruby 根本不这样做的原因。但是,有第三方库,例如 Unicode 库和 ActiveSupport,它们确实支持更大的字符子集。

关于ruby - 如何在 UTF-8 字符上使用 String 方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4418196/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com