gpt4 book ai didi

windows - 为什么 sort 命令在法语语言环境中对 "œ"和 "oe"进行无差别排序?

转载 作者:可可西里 更新时间:2023-11-01 13:27:22 26 4
gpt4 key购买 nike

有人可以用法语语言环境解释 sort 命令的行为吗?

$ file file.txt
file.txt: UTF-8 Unicode text, with CRLF line terminators

$ wc -l file.txt
4 file.txt

$ cat file.txt
cœz
coez
coe


$ sort file.txt
coe

cœz
coez

$ sort -d file.txt

coe
coez
cœz

$ env | grep -P "(LC|FR)"
LANG=fr_FR.UTF-8

“œ”小于或大于“oe”这一事实在常规排序的情况下似乎是随机的,而在字典排序的情况下该字符会被简单地忽略 (sort -d).

我想这与排序规则有关,但我想在这里了解一些情况。

最佳答案

字典排序可能会忽略 – 连字,因为它不在 ascii 中的 a-zA-Z 范围内。 (这是一个猜测)。

然后在法语语言环境中,oe 和 oe 比较相等,所以它们应该按照它们进入的顺序出现,这似乎是您正在发生的事情。如果这是正确的,那么如果你把它放在:

cœz
coez
cœm
coem
coep
cœp
coe

你应该得到这个:

coe

cœm
coem
coep
cœp
cœz
coez

您可以使用 -c(检查文件是否已排序)或 -r(倒序)选项来获取更多信息。

关于windows - 为什么 sort 命令在法语语言环境中对 "œ"和 "oe"进行无差别排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15813584/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com