gpt4 book ai didi

character-encoding - 未知字符 ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨

转载 作者:行者123 更新时间:2023-12-04 06:12:36 24 4
gpt4 key购买 nike

关闭。这个问题是off-topic .它目前不接受答案。












想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。

9年前关闭。




Improve this question




这是一个有点愚蠢的问题,但我今天偶然发现了这个奇怪的“字符”实际上有几个字符,但我不知道如何进一步分析它。

有任何想法吗?

谢谢

最佳答案

使用十六进制编辑器查看原始字符数据。您的示例包含三个具有特殊含义的多字节字符。干得好:

 ‍̸

U+0338 COMBINING LONG SOLIDUS OVERLAY

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xB8
UTF-16: 0x0338

C octal escaped UTF-8: \314\270
XML decimal entity: ̸

Annotations and Cross References

Alias names:
• long slash overlay

----------------------

‍̨

U+0328 COMBINING OGONEK

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xA8
UTF-16: 0x0328

C octal escaped UTF-8: \314\250
XML decimal entity: ̨

Annotations and Cross References

Alias names:
• nasal hook

Notes:
• Americanist: nasalization
• Polish, Lithuanian

See also:
• U+02DB OGONEK

----------------------

ı

U+0131 LATIN SMALL LETTER DOTLESS I

General Character Properties

In Unicode since: 1.1
Unicode category: Letter, Lowercase

Various Useful Representations

UTF-8: 0xC4 0xB1
UTF-16: 0x0131

C octal escaped UTF-8: \304\261
XML decimal entity: ı

Annotations and Cross References

Notes:
• Turkish, Azerbaijani
• uppercase is U+0049 LATIN CAPITAL LETTER I

See also:
• U+0069 LATIN SMALL LETTER I

我使用十六进制编辑器和用于显示字符映射的程序发现了这一点。也许你可以自己做。前两个是覆盖字符,这就是为什么您必须多次按退格键(它们不会在文本中生成空格;它们正在修改前一个字符的外观)。

这里没有人可以告诉你文本中的角色在做什么。你必须自己找出来。 (也许是文本文件中的随机二进制数据?)

关于character-encoding - 未知字符 ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7599219/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com