gpt4 book ai didi

unicode - unicode.RangeTable 如何工作?

转载 作者:IT王子 更新时间:2023-10-29 01:43:19 28 4
gpt4 key购买 nike

我需要一些帮助来理解 unicode 包的 RangeTable .

使用这个(据说有帮助的)功能:

func printChars(ranges []unicode.Range16) {
for _, r := range ranges {

if r.Hi >= 0x80 { // show only ascii
break
}
fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)

for c := r.Lo; c <= r.Hi; c++ {
fmt.Print(string(c) + " ")
}
}
fmt.Println()
}

对于数字,我可以执行 printChars(unicode.Digit.R16),数字序列对我来说很有意义。

 // Lo: 48 Hi: 57 Stride: 1
// 0 1 2 3 4 5 6 7 8 9

但是,要获取标点符号 printChars(unicode.Punct.R16) 结果为

 // Lo: 33 Hi: 35 Stride: 1
// ! " #
// Lo: 37 Hi: 42 Stride: 1
// % & ' ( ) *
// Lo: 44 Hi: 47 Stride: 1
// , - . /
// Lo: 58 Hi: 59 Stride: 1
// : ;
// Lo: 63 Hi: 64 Stride: 1
// ? @
// Lo: 91 Hi: 93 Stride: 1
// [ \ ]
// Lo: 95 Hi: 123 Stride: 28
// _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z {

令我惊讶的是小写字母也包含在内。另外,“步”是什么意思?除最后一个外,其余均为 1,但 hi-lo 差异各不相同。

再举一个例子,printChars(unicode.Pe.R16)。我认为这应该只给出结束标点符号:

  • ) 右括号 (U+0029, Pe)
  • ] 右方括号 (U+005D, Pe)
  • } 右花括号 (U+007D, Pe)

而是我的函数打印

 // Lo: 41 Hi: 93 Stride: 52
// ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ]

大概我完全误解了它的工作方式。

我如何才能正确获取给定类别中的字符列表,例如上面的标点符号结尾 (Pe)?

最佳答案

步幅是您必须在范围内迭代的步长。让我们稍微提高 0x80 的边界,并使用 Stride 使循环迭代:

package main

import (
"fmt"
"unicode"
)

func printChars(ranges []unicode.Range16) {
for _, r := range ranges {

if r.Hi >= 0x100 {
break
}
fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)

for c := r.Lo; c <= r.Hi; c+=r.Stride {
fmt.Print(string(c) + " ")
}
}
fmt.Println()
}

func main() {
printChars(unicode.Punct.R16)
}

这是输出:

% go run main.go

Lo: 33 Hi: 35 Stride: 1
! " #
Lo: 37 Hi: 42 Stride: 1
% & ' ( ) *
Lo: 44 Hi: 47 Stride: 1
, - . /
Lo: 58 Hi: 59 Stride: 1
: ;
Lo: 63 Hi: 64 Stride: 1
? @
Lo: 91 Hi: 93 Stride: 1
[ \ ]
Lo: 95 Hi: 123 Stride: 28
_ {
Lo: 125 Hi: 161 Stride: 36
} ¡
Lo: 167 Hi: 171 Stride: 4
§ «
Lo: 182 Hi: 183 Stride: 1
¶ ·
Lo: 187 Hi: 191 Stride: 4
» ¿

在我看来非常正确。

关于unicode - unicode.RangeTable 如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20176024/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com