gpt4 book ai didi

linker - C - 为什么 ANSI 仅指定 6 个字符作为外部标识符中有效字符的最小数量?

转载 作者:行者123 更新时间:2023-12-02 11:19:50 25 4
gpt4 key购买 nike

我对第一个 American National Standard for Programming languages - C 中的 5.2.4.1 翻译限制 部分有疑问,又称ANSI/ISO 9899-1990、ISO/IEC 9899.1990(E)、C89等。简单地说,第一个ANSI C标准。

标准说了什么这么奇怪?

它臭名昭著地指出,仅需要一个符合标准的 C 编译器来处理,我引用:

5.2.4.1 Translation Limits

  • 6 significant initial characters in an external identifier

现在,很明显,这是不合理的短,特别是考虑到 C 没有任何类似于 namespace 的东西。在处理外部标识符时允许使用描述性名称尤其重要,看看它们将如何“污染”您链接的所有内容。

甚至标准库也要求函数具有更长的名称,longjmp , tmpfile , strncat 。后者,strncat ,表明他们必须花一些功夫来发明库名称,其中前六个字符是唯一的,而不是可以说更合乎逻辑的 strcatn这会与 strcat 发生碰撞.

为什么这对我来说仍然是一个问题?

我喜欢老式电脑。我正在尝试编写能够在 C99 之前的平台上编译和运行良好的程序,而这些平台有时并不存在于我心爱的目标上。也许我也喜欢尝试真正遵循标准。通过深入研究旧标准,尝试追踪某些限制和实现问题的原因,我学到了很多关于 C99 和 C11 的知识。

因此,即使我知道没有编译器或链接器实际上强制或施加此限制,它仍然困扰着我,如果我也想使用清晰的代码,我就不能声称已经编写了严格一致的代码和非冲突的外部标识符。

他们为什么要强加这样的事情?

他们在八十年代初的某个时候开始进行标准化工作,并于 1988 年或 1989 年完成。即使在七十年代和六十年代,处理更长的标识符也不会有任何问题。 .

考虑到任何想要符合新标准的编译器都必须进行修改 - 如果只是为了更新文档 - 我不认为 ANSI 放下脚并说出类似于 的话有什么不合理的地方“已经是 1989 年了。您必须处理 31 个重要的首字符”。对于任何平台,甚至是古老的平台来说,这都不是问题。

向后兼容性?

根据我在搜索此内容时所读到的内容,问题可能来自 FORTRAN。在 answer对于问题What's the exact role of "significant characters" in C (variables)? , Jonathan Leffler写道:

Part of the trouble may have been Fortran; it only required support for 6 character monocase names, so linkers on systems where Fortran was widely used did not need to support longer names.

对我来说,这似乎是对直接问题为什么?的最合理答案。但考虑到每次我想编写一个理论上可以在旧系统上构建的程序时,这个限制都会困扰我,所以我想了解更多细节。

<小时/>

问题

  1. 在对 FORTRAN 轨道进行了一些搜索之后,我只提出了理论和挥手。哪些流行平台确实实际上只规定了 6 个字符的限制?是否有一个特别受欢迎的链接器迫使标准委员会做出让步?
  2. 我还不够大,在讨论这些细节时还没有兴趣。这一限制及其基本原理是否已被公开讨论和辩护?是引起了公众的强烈抗议,还是只是默默地忽视了? ANSI 总部外的干草叉?

最终,这些问题的答案将使我更容易决定为我的函数提供合理的名称,我晚上应该睡得有多糟糕。

最佳答案

30 年前 - 我在那里 - 世界上绝大多数代码是用 Cobol、Fortran 和 PL/1 以及绝大多数编写的在 IBM 370 系列大型机或兼容机上运行。最多世界上的 C 代码在 DEC 的 PDP-11 和 VAX 微型计算机上运行。Unix 和 C 诞生于 PDP,DEC 硬件是它们的据点。

这就是 ANSI C 委员会诞生的世界,也是他们所处的世界。考虑了用 C 编写的链接代码的实用性真正重要的语言、真正重要的系统。

Fortran 编译器是 Fortran 77 编译器,并且限制标识符6 个字符。当时,PL/1 编译器将外部标识符限制为 7 个字符。S/370 系统链接器将符号截断为 8 个字符。绝非偶然,PDP-11 汇编语言要求符号在前 6 个字符中必须是唯一的人物。

当 ANSI C 委员会的草坪上没有任何干草叉时,规定了外部标识符的 6 个起始有效字符。这意味着可以在 IBM 大型机上实现符合要求的编译器;并且它不必是 PDP-11 汇编器所在的那个不充分并且不需要能够发出甚至无法链接的代码与 Fortan 77。这是一个完全不合情理的选择。美国国家标准协会C委员会不能再“坚定不移”地改变IBM 大型机链接器比它本可以制定有关苏联导弹设计的法律。

It is 1989 already. You must handle 31 significant initial characters". It would not have been a problem for any platform, even ancient ones.

你的想法是错误的。将摩尔定律倒退 30 年并尝试想象一下委员会工作时计算机是多么微不足道。大型机一台支持数百个用户并运行所有数据处理系统的计算机一家大公司通常使用的处理能力、内存和资源都不足我今天在我的旧 Google Nexus 平板电脑上拥有的存储资源。

IBM 3380E 硬盘,1985 年,容量为 5.0GB,价格约为 12 万美元;按今天的钱计算是 27 万美元。它的传输速率为24Mbps,大约是我笔记本电脑高清硬盘的 2%。有了这样的参数,系统必须存储、读取或写入的每个字节,每一次光盘旋转,每一个时钟周期,都对底线产生影响。和情况一直如此,甚至更是如此。守财奴般的存储经济(以字节为单位)在计算机中根深蒂固。编程实践和那些简短的公共(public)符号名称只是一种根深蒂固的表达方式其中。

当然,问题不在于微不足道、昂贵得令人难以置信主导 20 世纪 80 年代文化和建议的大型机和迷你机不可能支持以下语言、编译器、链接器和编程实践:这种吝啬的存储经济(以及其他一切)都被扔掉了。他们当然可以,如果每个人都有一个,比如笔记本电脑或手机。他们不能做什么如果没有它,他们所做的就是支持他们购买的巨大的多用户工作负载运行。该软件需要极其精简,才能用很少的资源做这么多的事情。

关于linker - C - 为什么 ANSI 仅指定 6 个字符作为外部标识符中有效字符的最小数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38035628/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com