gpt4 book ai didi

perl - 您如何自定义文本分段以在有向图之间不中断?

转载 作者:行者123 更新时间:2023-12-04 14:37:46 24 4
gpt4 key购买 nike

作品:

#!/usr/bin/env python3
from uniseg.graphemecluster import grapheme_clusters
def albanian_digraph_dh(s, breakables):
for i, breakable in enumerate(breakables):
if s.endswith('d', 0, i) and s.startswith('h', i):
yield 0
else:
yield breakable

print(list(grapheme_clusters('dhelpëror', albanian_digraph_dh)))
#['dh', 'e', 'l', 'p', 'ë', 'r', 'o', 'r']

需要改进/定制:
perl -C -Mutf8 -mUnicode::GCString -E'
say join " ", Unicode::GCString
->new("dhelpëror")->as_array
'
#d h e l p ë r o r

perl6 -e'"dhelpëror".comb.say'
#(d h e l p ë r o r)

注意:编写自己的分段几乎可以保证不会正确实现 UAX #29 算作回避了问题。

最佳答案

D:\>perl6 -e "'dhelpëror'.comb(/dh|./).say"
(dh e l p ë r o r)

你可以在旧的 Perl 中做同样的事情。
print join ' ', 'dhelpëror' =~ /dh|./g

关于perl - 您如何自定义文本分段以在有向图之间不中断?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57622268/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com