- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
作为支持 unicode 的 C++ 开发人员,委婉地说,这是一件令人头疼的事情。 Unicode 有一些不幸的属性,这使得很难确定字母的大小写、转换它们或几乎任何除了识别单个已知代码点左右(可能是也可能不是字母)之外的任何事情。看来,唯一真正的拯救是 ICU对于那些不幸没有内置语言(即 C 和 C++)的 unicode 支持的人。其他语言对 unicode 的支持可能不够好,也可能不够好。
所以,我想,一定有 真正 unicode 的替代品!即除了具有查找数据结构(树、表等)和识别字符之间的关系之外,还允许轻松识别字符类的编码?我怀疑对于大多数文本来说,任何此类编码都可能是多字节的——这对我来说并不是真正关心的问题,但我承认这是对其他人而言的。提供这样的编码需要大量工作,所以我真的不希望存在任何这样的编码 😞。
最佳答案
简短回答:据我所知没有。
作为非 C++ 开发人员,我不知道 Unicode 的具体痛点是什么,但由于您没有使用 C++ 标记问题,所以我仍然敢于尝试回答。
虽然我个人总体上对 Unicode 非常满意,但我同意某些方面很麻烦。如果从头开始重新设计 Unicode,则可以说其中一些可以得到改进,例如。除了实际的希腊字母之外,删除一些冗余,例如“拉丁希腊”数学字母(但这也会破坏与旧编码的兼容性)。
但大部分的“痛点”,恰恰反射(reflect)了最初书写的困惑用法。你自己提到大写“i”的问题,在某些拼字法中是“I”,在其他正字法中是“İ”,但还有很多其他困难——例如。德语“ß”,它是小写字母,但没有对应的大写字母(好吧,现在有,但很少使用);或最终位置看起来不同的字母(希腊语“σ”/“ς”);或含义颠倒的引用(«法国风格»与»瑞士风格«,“英语”与“德国风格”)......我可以继续一段时间。
除了提供字符属性、等价关系和关系表之外,我看不出编码对此有何帮助,而这正是 Unicode 所做的。您在评论中说,通过查看编码字符的字节,您希望它告诉您它是大写还是小写。对我来说,这听起来像是在说:“当我查看一个数字时,我希望它能告诉我它是否为质数。”我的意思是,即使是 ASCII 码也不会告诉你它们是大写还是小写,你只是记住了属性表,它告诉你 41..5A
是大写,61..7A
是小写的。但是很难记住或硬编码所有 120k Unicode 代码点的这些范围。因此,最简单的方法是使用查表。
对于“编码”的含义也存在一些混淆。Unicode 没有定义任何字节表示,它只分配代码点,即。整数,字符定义,并维护上述表格。严格意义上的编码(“编解码器”)是转换格式(UTF-8 等),它定义了代码点及其字节表示之间的映射。现在可以定义一个新的 UTF,它以提供大写/小写模式的方式将代码点映射到字节。但那会是什么呢?大写奇数,甚至小写?但是没有大小写区分的字母呢?然后,不是字母的字符?那么所有其他字符类别——标点符号、数字、空格、符号、组合变音符号——又如何呢,为什么不也代表这些字符呢?您可以将每个字符都放在预定义的范围内,但是如果向其中一个类别添加了太多新字符会怎样?
总结一下:我不认为你要求的是可能的。
关于unicode - 有没有真正的 unicode 替代品?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48659324/
缓冲区溢出问题是众所周知的。因此,我们有幸使用标准库函数,例如 wcscat_s()。 Microsoft 的好心人已经创建了类似的安全字符串函数,例如 StringCbCat()。 但是我遇到了一个
HTTP缓存相关的问题好像是前端面试中比较常见的问题了,上来就会问什么cache-control字段有哪些,有啥区别啥的。嗯……说实话,我觉得至少在本篇来说,HTTP缓存还算不上复杂,只是字段稍
代理,其实全称应该叫做代理服务器,它是客户端与服务器之间得中间层,本质上来说代理就是一个服务器,在HTTP的链路中插入的一个中间环节,就是代理服务器啦。所谓的代理服务就是指:服务本身不生产内容,
我们在前两篇的内容中分别学习了缓存和代理,大致了解了缓存有哪些头字段,代理是如何服务于服务器和客户端的,那么把两者结合起来,代理缓存,也就是说代理服务器也可以缓存,当客户端请求数据的时候,未必一
在前面的章节,我们把HTTP/1.1的大部分核心内容都过了一遍,并且给出了基于Node环境的一部分示例代码,想必大家对HTTP/1.1已经不再陌生,那么HTTP/1.1的学习基本上就结束了。这两
我们前一篇学习了HTTP/2,相比于HTTP/1,HTTP/2在性能上有了大幅的改进,但是HTTP/2因为底层还是基于TCP协议的,虽然HTTP/2在应用层引入了流的概念,利用多路复用解决了队头
前面我们花了很大的篇幅来讲HTTP在性能上的改进,从1.0到1.1,再到2.0、3.0,HTTP通过替换底层协议,解决了一直阻塞性能提升的队头阻塞问题,在性能上达到了极致。 那么,接下
上一篇噢,我们搞明白了什么是安全的通信,这个很重要,特别重要,敲黑板!! 然后,我们还学了HTTPS到底是什么,以及HTTPS真正的核心SSL/TLS是什么。最后我们还聊了聊TLS的实
经过前两章的学习,我们知道了通信安全的定义以及TLS对其的实现~有了这些知识作为基础,我们现在可以正式的开始研究HTTPS和TLS协议了。嗯……现在才真正开始。 我记得之前大概聊过,当
这一篇文章,我们核心要聊的事情就是HTTP的对头阻塞问题,因为HTTP的核心改进其实就是在解决HTTP的队头阻塞。所以,我们会讲的理论多一些,而实践其实很少,要学习的头字段也只有一个,我会在最开始
我们在之前的文章中介绍HTTP特性的时候聊过,HTTP是无状态的,每次聊起HTTP特性的时候,我都会回忆一下从前辉煌的日子,也就是互联网变革的初期,那时候其实HTTP不需要有状态,就是个浏览页面
前面几篇文章,我从纵向的空间到横向的时间,再到一个具体的小栗子,可以说是全方位,无死角的覆盖了HTTP的大部分基本框架,但是我聊的都太宽泛了,很多内容都是一笔带过,再加上一句后面再说就草草结束了。
我的问题确实很简单,是否应该对适配器(设计模式)类进行单元测试,以及如何进行测试? 例子: 我想用PHP创建一个ClientSocket类,它是fsockopen,fread,fwrite的适配器。
目前,我在 PHP 脚本中使用此查询: SELECT * FROM `ebooks` WHERE `id`!=$ebook[id] ORDER BY RAND() LIMIT 125; 数据库最多大约
我们都知道可以使用 GetCustomAttributes 方法查询程序集的属性。我想用它来识别我的应用程序的扩展模块。但是,为了避免加载每个程序集,我更喜欢防御性方法: 使用 Assembly.Re
我正在移植一个非常大的代码库,我在处理旧代码时遇到了更多困难。 例如,这会导致编译器错误: inline CP_M_ReferenceCounted * FrAssignRef(CP_M_Refere
[关于此主题还有其他类似的问题,但是它们都没有回答我在这里提出的问题,即AFAICT。 (即,我已经阅读了所有答案,解释了为什么特定构造无法与发问者尝试进行的操作,在某些情况下,它们提供了获得所需结果
嗨 我想为需要全屏运行的网络艺术应用程序构建一个控制面板,因此所有控制颜色和速度值等内容的面板都必须位于不同的窗口中。 我的想法是建立一个数据库来存储所有这些值,当我在控制面板窗口中进行更改时,应用程
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
假设我想实现一个分布式数据库(每个节点都是其他节点的副本);我听说 cdb 能够轻松地在两个节点之间进行同步,并且至少支持某种形式的冲突解决。 不幸的是我不知道 couchdb 因此我不得不问:节点“
我是一名优秀的程序员,十分优秀!