gpt4 book ai didi

python - 按字母索引字符串,包括变音符号

转载 作者:行者123 更新时间:2023-12-04 07:39:37 24 4
gpt4 key购买 nike

我不知道如何表述这个问题,但我正在寻找一个神奇的函数来制作这个代码

for x in magicfunc("H̶e̕l̛l͠o͟ ̨w̡o̷r̀l҉ḑ!͜"):
print(x)
表现得像这样:





̨






基本上,是否有一个内置的 unicode 函数或方法,它接受一个字符串并为每个字形输出一个数组,其中包含所有各自的 unicode 装饰器和变音符号等?与文本编辑器将光标移动到下一个字母而不是迭代所有组合字符的方式相同。
如果没有,我会自己编写函数,不需要帮助。只是想知道它是否已经存在。

最佳答案

您可以使用 unicodedata.combining 找出一个字符是否正在组合:

def combine(s: str) -> Iterable[str]:
buf = None
for x in s:
if unicodedata.combining(x) != 0:
# combining character
buf += x
else:
if buf is not None:
yield buf
buf = x
if buf is not None:
yield buf
结果:
>>> for x in combine("H̶e̕l̛l͠o͟ ̨w̡o̷r̀l҉ḑ!͜"):
... print(x)
...





̨



l



问题是 COMBINING CYRILLIC MILLIONS SIGN不被识别为组合,不知道为什么。您还可以测试是否 COMBININGunicodedata.name(x)对于角色,应该可以解决它。

关于python - 按字母索引字符串,包括变音符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67561461/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com