gpt4 book ai didi

linux - 连字符更改为特殊字符 –

转载 作者:太空宇宙 更新时间:2023-11-04 05:14:38 24 4
gpt4 key购买 nike

我有一个来自 oracle fusion 的文件,名为 Hyderabad - Telangana

当我将其发送到服务器时,连字符已成为特殊字符 – 。

我们正在对此值进行查找,但由于特殊字符而失败。

我将文档下载到本地驱动器,并且可以正确看到连字符。

我尝试寻找解决方案,大多数人都说这是因为编码问题。

如何在unix中查找文件的编码?

最佳答案

因为它不是普通的连字符,而是 EN DASH,unicode U+2013。当以 UTF-8 编码时,它变成 "\xe2\x80\x93" 。第一个字节是'â'的代码,这引导我走上那条路。

有趣的是,另外 2 个是由 cp1252 处理的西欧语言 Windows 版本中常见的字符集分别是:

Byte      Character in cp1252 charset      Unicode code         Name
0x80 € U+20AC EURO SIGN
0x93 “ U+201C LEFT DOUBLE QUOTATION MARK

关于linux - 连字符更改为特殊字符 –,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50985423/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com