Oct 14, 2011 - UNIX 痛恨者手册读后笔记

Comments

UNIX 痛恨者手册[PDF]可以算是一本奇书了。一般的技术书,写作缘由大多是作者特别喜欢某样技术,兴高采烈地拿出来和读者分享。而此书的几个作者,都是因为恨 UNIX 恨到“人生长恨水长东”的境界了,于是乎搞了个邮件组,广泛收集各种愤怒,最后基于邮件组里面张贴的各种抱怨,编撰成了痛恨者手册这样一本书,来专门宣泄对 UNIX 的愤怒,也算得上是空前绝后了。</p>

尽管这本书视角独特,以现在的眼光看,作者的抱怨中,真正属于 UNIX 固有问题的只占 50%,其他如对 sendmail 排山倒海的批评,对 C++ 的尽情嘲弄,实际上都不属于 UNIX 系统特有的。其他的 50%,则颇有历史意义,可以看到当年的 UNIX 系统是何其的“原始”。特别是对照现在的 Linux 来看,可以看出 Linux 作为当年 UNIX 的继承人,在文件系统,安全性,稳定性等等方面的巨大的进步。

除去一些对 UNIX 中具体 BUG 的批评,这本书的背后实际上是三种设计哲学间的交锋,我把这三种哲学叫做 MIT 哲学,UNIX 哲学和 GUI 系统哲学。“MIT 哲学”这个词,是借用那篇著名的 Worse is better 文章中的叫法。MIT 哲学的代表是 LISP 机器,即提供一个 LISP 环境的机器。这个机器提供给用户的,是优雅的编程环境,如统一的内存管理,统一的函数式接口,良好的文档等等,一切程序员所需要的,都给准备好了。但这个系统不管是作为个人计算机还是作为工作站都没有获得成功。

GUI 系统哲学从施乐的 Alto 开始,到90年代中期 Windows 95 出现之前,已经颇有气象,特别是在个人计算机领域,几乎所有的个人计算机厂商都在提供自己的图形界面操作系统。GUI 系统的哲学,是友好的用户界面和一致的使用体验。至于具体的功能,则委托给具体的应用程序实现。

而 UNIX 哲学,则像是一种开放式系统的哲学:除去提供统一的系统调用和标准工具外(POSIX),不强调系统的一致性。UNIX 像是一堆松散的积木堆起来的一个系统,在遵守 POSIX 标准的前提下(其实是个非常松散的标准)各个厂商都可以自己选择积木搭建系统。

UNIX 这种开放的,允许自由搭积木的做法,是和信奉MIT哲学的人水火不容的。这些用户在 UNIX 的因为开放造成的不一致性上尽情吐槽。比如说,UNIX 一个饱受诟病的缺憾是其命令行参数不统一。在命令行下,有的命令加 -h 是显示帮助,有的却是显示隐藏文件,还有的命令压根不接受 -h 参数。这样的问题,反映了 UNIX 在演化过程中缺少一个统一的规划。这在演化路径单一的其他操作系统上是不可想象的。再比如,UNIX 的计算模型很简单,即用 C 语言和 shell 对系统调用做一个胶水包装,不提供内存管理也不提供异常处理,文件系统也很低级,不支持文件恢复也不支持文件的元信息存储。而 MIT 的LISP 机器的计算模型和存储系统看上去都更加高级,统一的函数式接口,自动内存管理等等。用过 LISP 机器的人自然不习惯 UNIX 这种看上去“低级”的操作系统。结果是,用过 LISP Machine 的用户除了抱怨 UNIX 外,只能寻求在 UNIX 上构建一个新的层,来弥补 UNIX 的不足。这事情的一个结果就是造就了Emacs 这个怪兽,到最后几乎所有能在 UNIX 里做的事情,都能在 Emacs 里完成。这样,除了操作系统内核外,Emacs 完全取代了 UNIX 环境。Emacs 功能强大到大家都同意 Emacs 是个万能软件,而 vi 用户则开玩笑说 Emacs 是个缺少一个好编辑器的操作系统。大家都知道,Emacs 的作者正是从 MIT 出来的 Richard Stallman。

痛恨者手册的作者也是在 MIT 的 AI 实验室工作多年的技术人员。为了解释 UNIX 的成功,他借用了 Worse is better 中的说法(Garbriel 断言 C 语言和 UNIX 是终极计算机病毒),把 UNIX 归类为世界上第一个计算机病毒。书中提到,UNIX 和病毒的共同特征为:体积小,可传染多种宿主(可移植),变异快速等等。书中说, UNIX 的普及并不是因为它在技术比其他操作系统更加优越,只是因为可移植,可传染和变异快,才占据了很大一块用户份额。

这个解释我认为是相当精当的。相对于其他操作系统,UNIX 基于C书写,可移植和早期的免费分发方式,即使技术上不够好,仍然像流行性感冒一样蔓延。一传十,十传百,快速攻城略地。当时 UNIX 的风行程度可以从几个侧面来证明。八十年代初雨后春笋一般地冒出了很多新的UNIX公司,SUN 和 SGI 就是是借着 UNIX 成长起来的典型例子。他们短短几年间就靠 UNIX 工作站业务跑上了纳斯达克。微软和苹果是靠个人电脑业务起家的,各自都有自己的操作系统,却也跑到UNIX世界下注,都曾经推出过自家的UNIX发行版(分别叫做 XenixA/UX)。UNIX这个”病毒”在工作站和服务器上的寄生能力极强,直到后来演化能力和传播能力更强的“病毒” Linux 的出现,加上 .COM 泡沫破裂的一场大洗牌,才把 UNIX 的市场份额压了下去。Linux 则彻底继承了所有的“病毒”特性,除去原有的体积小,可移植外,通过开放内核源代码,造就了现在从超级计算机服务器到嵌入式系统无处不在的现状。从设备总量来说,世界上从未有一个操作系统如 Linux 如此成功。

可惜的是 MIT 哲学派本身没有成功的操作系统产品用来作为比较(除了Emacs这个运行在UNIX上的程序外),因此在批评 UNIX 上火力就欠缺了一分。为了写出一本厚厚的痛恨者手册砸向UNIX,就需要来自另外一派,即信奉GUI哲学的用户的愤怒。

这些用户的愤怒,主要集中在易用性上。图形界面操作系统的出现,本质上就是为了解决计算机的可用性问题。在图形界面系统出现之前,掌握计算机的使用需要的是阅读厚厚的手册。图形界面出现后,只需要几分钟的演示,普通用户即可操作计算机完成一些简单的任务。这种效率的本质提升,正是施乐的 Alto 和苹果的 Macintosh 的革命性所在。而 UNIX 所拥有的,是一堆两个字母的命令,不一致的命令行参数,和一个实际上不是为 GUI 系统设计的 X 图形系统。命令难记,X 又臃肿,即使有了这些仍然没有构成一个统一的桌面系统(所以后来才有KDE 和  Gnome),也难怪用户吐槽不已了。

在这类来自 GUI 用户的抱怨中,出乎我意料的一条是对UNIX管道的抱怨。主要的批评点在于管道作为一种 IPC 机制本身不够强大,包括管道不支持双向数据流(双向管道的用例也极少),只能把数据作为字节流而不能传递结构化数据,和指针等等。从传统 UNIX 用户的眼光来看,这些指责是很不公平的。管道的作用是串接程序的输入输出,将小工具串成强大的工具链。但管道并不是 UNIX 上唯一的 IPC 机制,UNIX 有其他的 IPC 机制来支持管道之外的功能。换一个角度看,要求管道支持双向通信,结构化通信等等,正是从 GUI 哲学出发的对管道的批判。在 GUI 世界,进程间的通信有了两种新的方式:1、把小程序全部集成到一个大的多线程窗口程序中来进行线程间通信; 2、通过在不同程序间复制粘贴对象。从这两个角度考虑,自然会要求 UNIX 管道能像线程间通信一样双向,以及支持有结构的对象而不是单纯的字节流。

GUI 程序的这一套新的进程间通信机制,改变了所在平台的软件架构。UNIX 的软件架构,是围绕软件工具(Software Tools) 的概念展开的,归结起来就是每个工具做一件事情,且做到最好的哲学。因为 GUI 程序本身的复杂性,把林林总总的功能,放入一个大程序中让各模块直接在一个进程空间里互相通信成了一个通行的做法。比如电子表格软件中的公式计算,无需代理到 bc 这样的外部计算器中,直接由内置的模块完成。在这种哲学的指导下,为了给提供全面的解决方案,各种商业程序都追求大而全,内置各种可能用到的功能,因此体积也越来越大。几百兆大小的商业软件不足为奇了。UNIX 痛恨者手册推崇这种只能算局部最优的程序构建方法,而反过来抱怨管道这个另一个局部最优不够好,在我看来是有历史局限性的。

总的来说,这本书代表了 UNIX哲学以外的其他两种哲学对 UNIX 尖锐的批评,是值得当成UNIX 发展史的一部分而一读的。

Sep 27, 2011 - 编程珠玑番外篇-L. 高级语言是怎么来的-7

Comments

LISP 语言前传

Lisp 的主要设计者 John McCarthy 曾经就 Lisp 的发展史,专门写过一篇 History of Lisp 的文章。这里介绍的历史,基本史实部分参照了 John McCarthy 的这篇文章,以及同时期 MIT 的关于 Lisp 的技术报告。

Lisp 的历史要从 IBM 的神奇机器 704 说起。此时是 1954 年,尽管距离 1946 年第一台计算机 ENIAC 的出现已经八年了,商用计算机市场还仅仅起步。很早就进入计算机市场的 IBM 做出了一个影响深远的决定:发布一台可以进行浮点计算的,面向科学和工程的电子计算机。这台计算机,很朴素地跟着 IBM 之前发布的 701,702 后,被编号成 704(不知为什么 IBM 从来没公布过 703)。说 704 是神奇机器,是因为这台机器在计算机科学发展史上意义重大:世界上最早的语音合成程序就是由 Bell 实验室的科学家在 IBM 704 上完成的。 Fortran,Lisp 也是最早在 IBM 704 上实现的。

和当年的所有计算机一样,IBM 704 是个百万美元级别的大玩具,不是一般人甚至一般大学能够买得起的。好在 IBM 和大学的关系一向很紧密,在 1957 年的时候,决定捐一台 704 给 MIT。当时在 Dartmouth 教书的 John McCarthy 和在 MIT 教书的 Marvin Minsky 关系很好,因此这台即将到达的 704,即将成为 McCarthy 的新玩具。

当年部署一台计算机的周期很长,为了不让自己闲着,McCarthy 决定一边等机器部署,一边研究一下如果有了这台机器,可以做点什么。当时 Minsky 手里有一个 IBM 的项目,内容是使用计算机证明平面几何问题。既然计算机没来不能写程序,他们就只能从抽象的层面思考问题的解决方法。这个思考的结果,是开发一套支持符号计算的 Fortran 子系统。他们的基本想法是,用一系列的 FORTRAN 子程序,来做逻辑推理和符号演绎。

回头看,这条路的确绕开了没有 704 就写不了程序的路障。因为我们只需要大致了解 Fortran 能够做什么,不能做什么,无需实际 Fortran 编程,就可以假想我们已经有了一系列未来可以实现的子程序,然后只要在数学上证明这些通过子程序的组合,加上自动逻辑推理,就可以证明平面几何定理。这就把一个计算机工程学问题,抽象成了一个数学问题(日后这个领域被正式划归到人工智能的学科中,但在当时这还是属于数学问题)

这样,计算机没来之前,McCarthy 的最终结果,是一个用 Fortran 子程序做列表处理的简单系统。McCarthy 的这条路很现实的做法——如果不用 Fortran 而是自己写一个新的语言的编译器话,可能需要好几年的时间。而 McCarthy 当年还不是终身教授,投入到写作新语言这样旷日持久且不能保证成果的项目中去,不会对他的职业生涯有太大的正面作用。

704 送到 MIT 后, McCarthy 带着两个研究生,将之前计划的 Fortran 列表处理子程序实现了,并命名为 Fortran 列表处理语言 (FLPL) 。然而,因为 Fortran 语言本身的限制,McCarthy 对 FLPL 并不满意。他在写作自动求函数导数的程序时[a],发现 FLPL 的弱点集中体现在两个地方。

第一个问题是递归。我们在 Fortran 语言怎么来的这一节已经提到,704 上的 Fortran 语言是不支持递归的。而 McCarthy 心中所设想的语言,很重要的一条就是递归:没有递归,很多列表处理的函数只能用循环来实现,而循环本身并不是 McCarthy 设想的语言的一部分。熟悉函数求导的链式法则的读者可以想像,没有递归的求导程序是何其难写,因为函数求导过程本身就是递归定义的。

第二个问题是 Fortran 的 IF 语句。IF 家族的分支语句,在计算机程序设计中可以说必不可少。在 McCarthy 那里 IF 就更重要了,因为几乎所有有递归函数的地方就有 IF(因为递归函数需要 IF 判断结束条件)。相信读者都很熟悉这种 IF 结构

IF 条件 THEN
    一些语句;
ELSE
    另一些语句;
END IF

这是从 ALGOL 语言一脉相承下来的,很“自然”的 IF 写法。而早期的 FORTRAN 的 IF 写法却不这么直观,而是

IF (表达式) A B C

取决于表达式的值是小于零,等于零还是大于零,分别跳到(等价于 goto)标签 A, 标签B 或者标签 C。这个 IF 隐含了三个 Goto,可以说和结构化编程的实践截然相反,降低了程序的可读性。 Fortran 首创的这个三分支跳转的 IF 饱受诟病,Fortran 77 开始支持结构化的 IF,而 Fortran 90 标准进一步宣布三分支跳转的用法已经“过时”,不支持使用。

在 McCarthy 那里,Fortran 的三分支跳转 IF 也不方便。为此,在 FLPL 中,他试图用一个叫 XIF 子程序完成类似于 IF 的分支功能,用法是:

XIF(条件, 表达式A, 表达式B)

取决于条件的满足与否,XIF 返回表达式A 或者表达式B 的值。很快,他发现,用子程序的方法实现 XIF,在语义上并不正确。我们知道,在 Fortran 和其他高级语言中,函数参数的值在进入函数之前必须全部确定。在 XIF 这里,不难看出,不管条件满足与否,我们都先要计算表达式A 和表达式B 的值。而 IF 是个分支逻辑,从语义上来说,应该只计算满足条件的分支的值。因此,用函数来实现 IF 是不正确的 [b]。

作为一个旁注,尽管 John McCarthy 早在50多年前就发现了函数实现 IF 是语义错误的,现代的程序员还常常犯这个错误。一个值得一题的例子是 C++ 逻辑运算符重载和短路表达式的不等价性。我们都知道,在 C 语言中,逻辑与 (&&) 和逻辑或( || ) 都隶属于短路表达式,也就是说,对于 A && B 这样的表达式,如果 A 已经确定为 false,就无需计算表达式 B 的值,即 B 的计算被”短路”。以 C 为蓝本的 C++ 一方便保留了这些短路表达式,另一方面在面向对象的特性中,引入了运算符重载。具体来说,只要一个对象定义了 operator&& 成员函数,就可以进行 && 运算。乍一看,这是一个很酷的特性,可以让程序员用 A&&B 这样的数学表达式表达复杂的逻辑关系。然而,仔细想想,  A.operator&&(B) 在语义上并不等价于 C 所定义的 A&&B,原因在于 A.operator&&() 是个函数,在求值之前需要先计算 B 的值,而后者是个短路表达式,本质上相当于

IF A:
 return True
ELSE:
 return B
因为短路表达式不一定会对 B 求值,这两者从语义上就是不等价的。如果 B 不是一个简单的对象,而是一个复杂表达式的时候,对 B 求值可能有副作用,而这个副作用,是写 A && B 并把它当做短路表达式的程序员所没有预见的。按照 C++ Gotcha 的说法,这很容易造成潜在的程序 Bug。实际上,C++逻辑运算符重载是一个危险的特性,很多公司的编程标准都禁止使用逻辑运算符重载。

递归和 IF 两个问题,使得 Fortran 从本质上就不符合 McCarthy 期望,以 Fortran 为宿主的开发列表处理语言也不可能达到 McCarthy 想要的结果。因此,唯一的解,就是抛开 Fortran,从头开始,设计一个新的语言。值得注意的是,此时 McCarthy 正好跳槽到了 MIT 做助理教授,MIT 有足够多的编程强人,可以帮 McCarthy 完成这个编写新语言的任务。这个强人,就是 Steve Russell;这个语言,就是 Lisp。

[a] 读过 SICP 的读者会发现这是一道习题

[b] 读过 SICP 的读者会发现这又是一道习题

 

Aug 7, 2011 - 童子军军规和习惯培养

Comments

我最喜欢的饼干是美国的女童子军饼干。这种饼干由女童子军协会统一制作,然后交给每个童子军支部售卖。参与童子军训练的小女孩通过售卖饼干,学会设定目标,制定计划,协调分配,管理财务,以及领导团队。每年春天,在美国生活的人都会在大大小小的超市门口,看到一群女孩子卖饼干。这些训练,是读书完全不能企及的。男童子军(与女童子军是独立的两个组织)的训练也很有特色,还记得 Up 里面的那个胖嘟嘟的小男孩么?他就是男童子军的一员,为了拿到一枚“野外探险”的徽章,居然误打误撞到南美转了一圈。要是想成为鹰徽童子军(男童子军最高级别),需要一系列的徽章,难度基本上和在 Foursquare 上拿全所有徽章差不多。

男女童子军训练是很多国家儿童素质训练的重要一环。人的性格和习惯到了成年实习就比较难改变了。未成年时期的如童子军训练这样的项目,是培养一个“人”的很好的方式。人生中的最重要的好习惯,往往是在幼年少年时期,甚至在幼儿园学到的。实际上,对好习惯进行有意识的培养是社会教育应有的部分。因为这些好习惯不光可以塑造一个“人”,也能够让所在的社会更加美好。这些好习惯可以推广到生活和工作的很多方面。比如程序员们很熟悉的 Bob Martin 大叔,就围绕这一条男童子军的“整洁”的“军规”,[硬生生写了本叫做 ](http://www.informit.com/articles/article.aspx?p=1235624&seqNum=6)。这条军规的背后,是童子军创始人 Baden-Powell 留给男童子军的最后的话,当你离开一个世界的时候,试着让这个世界比你发现他的时候更加好 (Try and leave this world a little better than you found it)。这句话的指导意义,既用在定义人生上,也可以用在整理房间上,或者对公共场所垃圾的处理上。当然,也可以像 Martin 大叔一样用在代码重构上。

因为内人是女童子军成员,最近准备搬家整理东西的时候,整理出了一大捆女童子军训练的材料,其中一本叫做“6-9年级女童子军手册”的书,我不经意瞄了一眼,觉得有些话写得真好,特别是女童军的“成功生活”的八个原则,因此简单的翻译一下。

女童子军的“成功生活”的八个训练:

  1. 管理你的时间 (Managing Your Time)

  2. 正确处理压力 (Handling Stress)

  3. 学会表达自己 (Speaking up for yourself)

  4. 时刻保持安全 (Stay safe)

  5. 获取管理钱财 (Earning and managing money)

  6. 注意合理消费 (Becoming a responsible consumer)

  7. 准备满意职业 (Preparing for satisfying career)

  8. 做负责任抉择 (Making responsible decision)

这八条原则如果孤立开来看,就和市面上大部分成功学书一样,并无特别之处。不过,考虑到这是未成年时期的训练,效果和成年之后再主动反向训练,难度是有区别的。现代认知心理学的一个基本假设是,人可以通过提高自己的认知能力(心智),改变自己的思维方式,对事情的看法,控制(相对难以控制的)感情,以及获得精神上的愉悦和在现实中的成功等等。少年时期的这些训练,正是对人认知能力的一种系统性的提升。成年之后用认知心理学方法反过来训练大脑和行为习惯,固然目标明确,却有事倍功半之感。

我觉得我小时候很幸运,有意无意的受到了多方面好习惯的训练。相信很多读者都受过类似的好习惯的训练,不过像童子军这样分门别类为这些好习惯设置配套训练项目还是第一次见到。如果将来我有小孩子,一定送他/她参加这样的童子军训练。诸位读者中有不少家长,想必也很注意对小孩的好习惯的培养,或许参阅美国的童子军训练的一些项目会有一些新的启发。

Jun 26, 2011 - 技术文章的质量

Comments

推友

@StarrySource 就微薄和推特的好坏问题写了一篇文章,正好和霍炬的文章同时发出来,推特上对这两篇文章叫好的人不少,其中还有一些直接就说 StarrySource 这篇比 virushuo 写得好。文章好坏诚然是个很主观的事情,不过就仅从文章内容来说,就算有一千个读者一千个主观标准,我也想不出什么理由来说明 StarrySource 的这篇比 virushuo 写得好,因为客观上这两篇文章的差距会抵充掉主观上的一些好恶。

在 StarrySource 的文章中,推特的开放性是一个事实判断,但是不是因为推特刚开始太小所以才做 API 的就很难说了。要知道,推特做 API 的时候,正是 flicker 和 delicious 靠 API 赢得了大量用户的时候。我们很难反向的说当年做 API 不做客户端是人手不够,我们也没见到人手够的 flickr 做看图传图的客户端,即使是在被 Yahoo! 收购之后。小公司以开放式 API 起家的奇迹,推特是非常特别的一个。现在推特开始做客户端什么的也的确是一个事实判断,但是多大程度会影响它的开放平台就很难预测了。它提供一条龙的服务,不意味着初期的开放策略受到了影响,而仅仅是推特开始挤占一些上下游而已。

新浪出手做微薄的时候,也邯郸学步做了 API。StarrySource 文在这里试图通过对比推特和新浪的策略不同,来说明新浪的用户体验很好。新浪有图床有富媒体呈现是事实,遗憾的是新浪在所谓的开放式 API 上,也和当年没图床的推特一样,做出了一套不支持上传图片的 API,对富媒体的支持却和 Web 界面不相匹配,这就特别奇怪了。更加奇怪的是, GEO (用户地理位置)在微薄上根本就不是一个显著的特性,因为微薄用户不比推特这样,大部分是移动设备用户,况且中国的地理定位的基础设施几乎没有,但新浪偏偏和推特一样,有 GEO 部分的 API。要知道推特是靠 GEO 赚了钱的,所以这就奇怪到家了。 从这个例子不难看出,虽然事实是新浪做的东西是推特的超集,实际上还是跟在推特后面试图复制推特的特性,并加入自己擅长的特性。这里微薄从来就没有过一以贯之的想着“要提高用户体验”。我想整个新浪产品线都不是从提高用户体验出发设计的,这一点只要用户新浪产品的用户都体会到。

至于在产品设计这节的观点,和菜头和@virushuo 已经说的够多的了,无需多话。在用户这节作者对言论审查,言论,小圈子等等的阐述,只会让经历过推特的人觉得不值一驳罢了。虽然我不知道 StarrySource 推友的背景,但仅从这篇文章的内容看,抽取掉事实之后,得到的是几个零散的观点,不构成论证的观点;相比之下,霍炬这篇有完整的论据,论证,甚至还包括了不少从论证引出的可证伪的论断。我想,不能因为主观上喜欢新浪微薄,就说霍炬的文章写得烂吧。

推特上推友开玩笑说这文章好像可能吧的文风。可能吧的文风是什么样子的呢,我有体会。首先,文章有充足的事实和引用,就差直接引用原文了。其次,文章不管内容多少,总要组织成一小节一小节的,用写书的结构写一篇2000字的博客文章,这样给人的印象是思维清晰。然后,排版是所有的中文博客里不是最好就是第二好的。一篇技术评论,有了上面这三样,再有一些不太离谱的观点和文字填充一下,基本上就可以算是一篇在中文圈子里相对好的文章了。受众反正也极少看英文的东西,所以我想可能吧访问量还不错。我和可能吧没什么过节,以上就是说说而已。对于我个人来说,我不订阅那些一个月写三篇以上的“干货”博客,因为我不相信这些内容的质量。好文章需要有深度思考和长期观察,而很不幸,这两样是稀缺资源。一个月的阅读和思考的结果,说不定也就够写一篇文章。

Mar 21, 2011 - 编程珠玑番外篇-K. Plan 9 的故事(修订版)

Comments

(本文是对于之前编程珠玑番外篇系列中 Plan 9 的八卦这一篇的彻底修订,本文得到了博文视点的卢鸫翔编辑的很多帮助)
计算机发展史上,创新性产品层出不穷。其中,有些想法和产品在技术上很先进,却很遗憾的没有获得广泛的接纳和商业的成功。不过,只要时机到来,这些创新,往往都会以新的面目再次复兴。</p>

这样的例子在历史中屡见不鲜。Jobs 和 Apple 分手后开创的 NeXT 公司的操作系统和硬件设备,创新点很多,市场反响却不大。而 NeXT 系统在软件和硬件设计上的创新,以及工业设计的思想,最终成为了现在 iOS 系统、Mac 系统软硬件设计的基石。同样是 Apple, 当年出品的 Hypercard 软件,首创了超文本格式和交互式页面。虽然 HyperCard 的这些创新在当时并不显得太出众,最终被苹果终止开发。但到了 Internet 出现之后,Tim Berners-Lee 受到这种“超文本 (hypertext)”格式的启发,将这些思想平移到联网的计算机上,由此出现了万维网。Ward Cunningham 更是受这一张一张的“数字卡片”受到,发展出了世界上第一个 wiki 系统 WikiWikiWeb。所有的这些例子,都说明了一项当时未必得到大多数人认可的创新可能会在意想不到的地方凤凰重生。 本节我们介绍的 Plan 9 操作系统,也是这样的一个例子。

FTPFS 虚拟文件系统

大部分读者应该都用过 FTP 在两台机器之间传送文件。FTP 是一种简单成熟的传输协议。试想现在我们需要修改一个 FTP 服务器上的文件,我们无法直接用本机上的编辑器打开这个远程的文件编辑,而需要先下载这个文件,修改后再上传。这种编辑远程文件的方法显然比编辑本机的文件麻烦多了。 我们退后一步仔细想一下这个不方便,会发现,文件是同样的一个文件,只是因为文件不在本地,我们需要借助于 FTP 协议访问,所以我们就不能直接编辑它了(事实上有些功能强大的编辑器如 VIM 仍然可以编辑,但普通的编辑器则不能)。在一切都是文件的假设下,我们可以不加区别的访问软盘,硬盘和闪存盘上的文件,但这里,因为中间多了一个网络协议,这种“一切都是文件”的方便特性就消失了。 因为这个需求很常见,很多 FTP 客户端,如 Windows 下的 LeapFTP, Mac 下的 Cyberduck,都做了一个贴心的功能,在你想要编辑远程文件的时候,自动将其下载成一个临时文件,等你修改结束后又自动上传。但是这依赖于 FTP 客户端,并不是每个客户端都提供了这类支持。

FTPFS 就是针对上面提出的这种不方便而出现的一种技术。通过利用一个叫做 FUSE (Filesystem in Userspace) 的技术,FTPFS 允许用户将远程的 FTP 文件系统挂载到本地的文件系统上,使得用户可以像操作本地文件一样操作远程文件1,包括查看,编辑,删除和重命名等等。而实际网络传输协议的细节,则对用户隐藏了。实际上,FUSE 技术可以用来实现很多“虚拟”的文件系统,而不仅限于将 FTP 文件系统挂载到本地文件系统上这一种。比如,使用 HTTP 协议的文件系统,SSH 服务器上的文件,Flicker 上的图片,维基百科上的文章,都可以通过 FUSE,抽象成一种虚拟的挂载在本地文件系统上的文件系统。这些虚拟的文件系统,隐藏了协议的细节,将各种不同类型的协议支持下的资源抽象成一个文件系统,也可以挂载到本地的文件系统上。

虚拟文件系统能把资源无差别的抽象成文件系统。这种做法消除了网络协议的不同造成的访问障碍,方便了用户对各种不同资源的访问。这种 “消除协议差异,一切资源都是文件”的思想,实际上来源于 Plan 9。毫不令人惊讶的是,在 Plan 9 中,干脆就没有 FTP 这个命令,所有对 FTP 的操作都是采用挂载 ftpfs 挂载文件系统的方式实现的。

一切都是文件(这次是真的)

上面我们提到了虚拟文件系统可以把资源无差别地抽象成一个文件系统,而这个思想是来源于 Plan 9 操作系统的。且慢,早在 UNIX Programming Environment 中, Brian W. Kernighan 就提出了 “UNIX 中,一切都是文件” 的设计哲学。事实上,UNIX 中的确很多对象是文件:进程是文件,设备是文件,命名管道也是文件。但是,也有很多不是文件,尤其是由其他非 Bell 实验室加入 UNIX 的组件。举例来说,计算机网络设备和服务不是文件(UNIX 的网络支持部分最先由 UC Berkerly 开发),图形界面中的对象也不是文件(UNIX 的图形界面支持最初由 MIT 的 X 工作组开发)。“一切都是文件” 这个口号因为 UNIX 的发展和新模块的加入而不再贴切。

UNIX 出现的时候,支持的设备都很简单,都可以抽象成文件交由内核统一管理,由内核提供 read/write 等系统调用访问设备。随着硬件的发展,一些新的硬件需要有超越系统调用范围的控制方式(例如我们可以控制光盘驱动器弹出托盘,而这个操作在传统磁盘驱动器上是不存在,也不能简单的抽象为 read/write 甚至 unmount 操作),或者为效率着想,需要用户空间程序直接和设备通信(如网卡,高速硬盘)。因为这些需求,和为未来扩展性考虑,Bell 实验室在 UNIX 第七版中,也不得不引入 ioctl 等具有无穷扩展性的系统调用机制,配合设备驱动程序,支持对设备的控制。这些做法,绕开了原先统一的 read/write 设备访问方式。也就是说,设备再也不能简单地抽象为文件了。

随着 UNIX 发展而失却的“一切都是文件”的纯粹哲学,正是 Plan 9 想要恢复的。在 Plan 9 中,通过实现一个叫做 9P 的文件协议,用户可以自由的把任何资源或服务抽象成本地的一个“虚拟的”文件或者目录,而对这些文件的操作,会通过 9P 协议,自动映射到对原来资源或者服务的操作。 这样,访问资源的各种细节就被隐藏了。在对付那些需要 ioctl 或者其他控制机制的设备或者应用程序时,Plan 9 提倡将程序的控制部分抽象成一个支持 read/write 的 ctl 文件,而非使用专门的 ioctl 系统调用。这样,其他程序就可以通过读写 ctl 文件与被控制的程序通信。从对资源和对控制的抽象不难看出来,Plan 9 把 UNIX 中“一切都是文件”的思想做了进一步的升华。在 Plan 9 里面,真的是一切都是文件了──设备是文件,窗口管理器是文件,Email 程序是文件(实际上所有程序都是文件),网络是文件(实际上所有服务包括 DNS 都是文件),等等。

Plan 9 的创新

要说 Plan 9 的特性,就不能不先介绍一下它的几个创造者。和 UNIX 一样, Plan 9也是从 Bell 实验室计算机科学研究中心开发的。其项目主要负责人是 Rob Pike (现在在 Google 工作,负责 Go 编程语言),当时在 Bell 实验室的很多人,包括 UNIX 的两位创始人,Ken Thompson 和 Dennis Ritchie ,以及 Brain Kernighan、Doug Mcllroy (UNIX 管道的提出者)都参与了这个项目的开发。从某种意义上来说,Plan 9 有点充当 UNIX 继承人的味道。事实上 Rob Pike 最初,也的确是想构建一个更加“现代的 UNIX”。除了坚持 UNIX 中已经成功了的“一切都是文件”,“KISS”等原则外,Plan 9 在原有 UNIX 的设计理念上做了新突破,其中最值得一提的,就是“分布式操作系统” 的理念。

Plan 9 这个分布式操作系统的出现和当时计算机发展的趋势是密不可分的。我们都知道, UNIX 是一种分时操作系统,用户分享机器资源。UNIX 操作系统则负责在各任务(或者说进程)之间调度。因此,UNIX 是一个中心化的操作系统。CPU、内存、IO 以及所有的任务的调度都是集中被 UNIX 管理的。上世纪 80 年代中期,更加便宜的微型计算机开始普及。这些微型计算机各自有着磁盘、CPU、内存和 IO 设备。Plan 9 的指导思想,就是把微机组织起来,方便的实现资源共享。

Plan 9 里,能共享的资源包括文件系统、图形界面、IO 设备、以及 CPU 和内存等计算资源。这些资源之间千差万别,我们固然可以针对每种资源设计一个协议,如文件分享用 NFS,图形界面用 X 协议,打印机用 CUPS 协议等等,不过这种做法在 Plan 9 的设计者看来是不够优雅的。他们采用的,是在上文我们已经提到过的“一切都是文件”的方法[cite:Plan 9, a distributed system]。我们可以用两个很有启发性的例子来说明。

例一、替换 CPU

假想一下我们有一台日常使用但性能不佳的笔记本,和一台不在本地但性能强劲的服务器。 我们当然能够使用远程计算机的强劲的 CPU 运行一些计算量特大的程序。这不是什么难事,因为几乎所有操作系统都支持登陆到远程的机器。然而,麻烦的是,如果在远程运行程序需要读写本地的文件,或者访问挂载在本地笔记本上的打印机,扬声器麦克风之类设备,我们除了在本地和远程之间把文件传来传去之外,并没有什么好方法。特别的,如果我们想借用另一台计算机上强劲的 CPU 做音频和视频解码,来播放一个放在本机光盘驱动器里的电影文件的话,我们是不可能指望远程计算机既能读本地的光驱,又能把音频投递到本机的扬声器上的。

Plan 9 中,有一个简单的 cpu 命令,能够让用户自然地使用一个其他机器上的 CPU 运行程序,且仍然能够访问本地的所有文件和设备。也就是说,我们可以用远程计算机上强劲的 CPU 做图像处理,媒体解码等任务,并且可以直接把声音播放到本地的扬声器。cpu 命令给人的感觉,是除了给机器换个了 cpu 外,其他一切都和原来一样。这个看似 “神奇” 的功能,其实在 Plan 9 里实现起来一点都不复杂: cpu 指令首先连接服务器上,然后将本地的所有资源和文件系统,包括窗口管理器,光盘驱动器,扬声器等设备(别忘了他们都是文件),一股脑儿挂载到服务器上,成为服务器上的资源。这样,在服务器上运行的程序,就可以“自然地”使用本地的键盘鼠标和显示器完成交互,还可以访问你本地的显示器扬声器等设备。

cpu 命令真的就是名副其实的换掉了本地计算机的 cpu (其实还有内存)而保留其他一切设备。Plan 9 的这个 cpu 命令,带有强烈的分布式操作系统的特征,而我们平时接触的操作系统都不是分布式操作系统,因此 cpu 这个命令至今在现代主流操作系统上没有完全等价物。

例二、进程间控制和通信

进程间通信可以提高使用计算机的效率(详细请参见 Page XX:开发人员为何应该使用 Mac OS X)。UNIX 下的管道就是一个经典的进程间通信的例子。在图形界面程序和集成化的程序出现后, 应用程序不断的把多种功能集成到一起,进程间通信反而变得相对困难了。比如说,即使有个给汉字加拼音的程序,除了来回复制粘贴,我们还是不能方便地从文字编辑程序中选取一段自动加上拼音。而 UNIX 下的编辑器可以借助管道很简单完成这样的操作。这个问题的本质困难,用操作系统的眼光来看,在于进程这个对象,没有在运行时暴露出应有的通信和控制接口。

Plan 9 的一切都是文件的思想从一个新的角度,解决了程序间的数据共享问题。Plan 9 倡导应用程序在运行时都把自己的内部状态抽象成一个文件系统。举例来说,一个邮件客户端程序不光支持图形界面下查看邮件,用户还能够直接通过

cat /mail/fs/inbox/1/subject
cat /mail/fs/inbox/1/body

来查看收件箱(inbox)中第一封邮件的主题和内容。这种设计,使得应用程序不再成为进程间通信的障碍,从而拷贝粘贴也变得没有必要。比如说,我们可以直接把草稿箱里邮件的内容通过管道送给其他拼写检查器。邮件客户端提供的拼写检查器再差也没关系了。这种把应用程序中的对象暴露出来的想法,和 Mac OS X 中的应用程序暴露一个Applescript 字典的设计思想异曲同工。

同样的道理,Plan 9 也从一切都是文件的思想出发,解决了了程序控制问题。 Plan 9 鼓励每个应用程序和设备在抽象成文件的时候,都暴露出一个抽象的 ctl 文件。这样,其他应用程序可以通过向 ctl 文件写命令的方式,运行时控制应用程序。举例来说,Plan 9 的窗口管理器 Rio,提供了 ctl 文件,我们可以通过读取和写入 ctl 文件,实现一些 Rio 本身不支持的如平铺所有窗口的操作。同样,通过对邮件程序的 ctl 操作,我们可以实现邮件的发送和接受的控制等等。Mac OS X 下的 Applescript 也可以完成类似的功能。遗憾的是,除了 Plan 9 和 Mac OS X,其他操作系统对这类进程间控制和通信的支持都不够完整。

实践者指南

上面介绍的 Plan 9 特性,可以说仅仅是冰山一角 Plan 9 里还有很多其他创新,如 Rio 窗口管理器简化了窗口管理,fossil 文件系统使增量备份毫不费力,/proc 文件系统方便对系统的控制和支持远程 debug 等等。我们可以在桌面通信的 DBus 标准,Mac OS X 的 Time Machine, Linux 的 /proc 文件系统里找到这些技术的影子。因为 Plan 9 从来就没有大众化,有不少创新不为外人所知。</p>

对 Plan 9 感兴趣,想要更多了解 Plan 9 的读者,可以到 http://plan9.bell-labs.com/plan9/ 下载 Live CD, 并在多台联网的机器或虚拟机中安装该系统。喜欢 Plan 9 里的一些命令,而不想折腾系统的读者,可以到 http://swtch.com/plan9port/ 下载可以在 Linux,Mac OS X 等主流操作系统上运行的 Plan 9 的移植程序。Rob Pike 的网站 cat-v.org 有最完整的 Plan 9 的资料,以及对 UNIX 设计哲学的反思。

Plan 9 中的很多思想,如/proc sysfs,还有 userspace 的虚拟文件系统,对 IPC 的重新处理如 DBus ,轻量级别的窗口管理器,UTF-8 等等,实际上都融入了 Linux 等现代操作系统。对于 Plan 9 这样含有众多优秀设计思想的操作系统,为什么最终没有流行开来,自然是很多人关心的。 ESR 曾经说,可能是因为当时 UNIX 已经足够好了。这样的解释很容易让人想起那句著名的 Worse is better。具体是什么原因呢,就交给各位读者思考了。