(本来想写 Jolt 大奖的八卦的,发现读书太少没法写,只能写成扯蛋文了)

在互联网,特别是 web 出现之前,信息的比特是通过其他网络传播的。在程序员之间,那时候大部分小程序都是直接贴在杂志上的,而大的程序则通过人之间互相拷贝来实现。

在 杂志上贴可以运行的代码和实现技巧对于我们现代人来说已经不是什么潮流的东西了,可对当年的程序员来说,每月一期的杂志简直就是无价的宝贝--上面充满了 其他天才写的几十行的小游戏和小工具,还有实现技巧。 在计算机科学中,CACM 可算是杂志上贴代码的巅峰。在 Communication of ACM 还是非常高深的期刊的时代(现在变成科普期刊了,以前大多是专业文章),因为人人都在这个杂志上贴代码,所以 ACM 决定对算法编号,这些编了号的算法日后就成了一个巨大的算法库,被称作 CACM Algorithms. 有兴趣的读者可以自己去看看这些千奇百怪的算法 ( http://calgo.acm.org/). 这套算法命名体系是曾经是如此的通用,覆盖又是如此的广,以至于现在仍然会有黑客直接说 algorithm 232 (CACM 232号算法是一个堆排序的实现) 而不是 heapsort 等等。

在美国,这样的为开发人员服务的杂志全盛时期并不长,尤其是 mailing list 和互联网普及之后,就在逐渐的消亡。web 出现之后,这些杂志很快就被全部打败了。 我们这里要八卦的 Jolt 大奖,就是由曾经这样的一个为开发人员服务的杂志发起的。这个杂志的名字叫做 Software Development。 可以想像,随着软件工程往大方向走,这个杂志除了放点技术评论和书评,基本上很难和互联网以及mailing list 抗衡。 软件工程复杂化一方面造成原来愿意给杂志写稿的人更加愿意写书,另一方面造成原来愿意读杂志的人,要不去上网获取快速知识,要不干脆捧起大部头。 所以,这样一个杂志,在互联网时代,就只能以技术和行业评论为利基了。 SD 杂志在可以说在这个利基上做的非常好,最有名的就是推出了 Jolt 大奖。

Jolt 是美国的一种能量饮料,据说喝了能活力百倍。Jolt 大奖就是奖励给那些给程序员提供活力,生产率的工具,产品,图书,理念,最佳实践等等。 因为 Jolt 从一开始就邀请专家组来提名评审,而非让普通人投票,所以有很浓重的奥斯卡色彩,这 Jolt 大奖也被成为软件产业的奥斯卡。 Jolt 大奖其实只是一个概称,常常一个 Jolt 奖, 三个 productivity 奖,基本可以理解成一个一等奖三个二等奖。 读者都知道软件行业里图书也好,工具也好,每年都层出不穷,自然 Jolt 奖是一个竞争激烈的奖。Jolt 奖从 1990 年开始颁发,到现在已经将近 20 年了。我整理了一份这20年 Jolt 奖的所有图书的单子,有心的读者可以看看,应该能看出这20年软件工程发展的脉络的。 Jolt 奖现在已经涵盖到 12 个分项(所以每个月提名一项),我觉得一个追求不落后时代的开发人员还是可以时不时看看 Jolt 奖的提名的那些技术和图书的。

Jolt 奖并没有能够拯救 SD 杂志被 Web 杀死的趋势。 在 2006 年左右的时候,SD 杂志把出版部门全部打包卖给了 DDJ, 另一个以贴 BASIC 代码起家的杂志,自己专心做 web 新闻站了。 DDJ 也没有撑过几年,于 2009 年,把出版部门全部出让给了 Information Week, 仅每月在杂志中间留这么10页左右的技术评论。 早在互联网杀死新闻周刊之前,互联网就把这些技术杂志全部杀死了。 好在 DDJ 这类杂志还能继续在网上运营,所以 Jolt 大奖始终还有评选。 只是互联网成了程序员的新 Jolt,这个 Jolt 是如此的无孔不入,以至于传统媒介都被杀得丢盔卸甲了。

本文尤其欢迎图老师留言讨论。

33 comments

养儿防老

才给我爸妈打电话,他们十分钟前才把我弟弟送上来美国的飞机。我和他们打趣的说:“你们又送走一个儿子,这下两个全在美国了,你们身边没有儿孙满堂绕着转了”。其实我爸妈倒是很开明,他们身边的人对他们不把孩子留在身边以养儿防老表示关切的时候,他们总是说:留在身边影响小孩发展,不如全送出去。

从我个人来说,虽然基本上被美国价值观改造得以后绝对自己不养儿防老,对父母我还是要尽赡养的责任的。我觉得这个是道德和经济上都理智的选择。 道德上我就不扯大旗了,说说经济上。贵国 我的伟大的祖国 的人都知道,贵国 我的伟大祖国 特色的社会主义的一大特色就是普通人没有像样的社会医疗保险。我父母(特别是我妈),在辛苦工作交税一辈子之后,拿到的养老保险和退休补贴非常有限。人一老,收入是有限的,医疗上的支出却是摸不着底的。我小时候看到很多邻居老人因为一场大病搞得破产分家的都有,深切体会过这个扯蛋的体系对人性的撕扯。况且现在这个局势发展下去,就是地主家也没有余粮了,何况我们普通人。所以从经济上说,我父母这一辈,除非那1%靠纳税人防老的,普通人还非得靠养儿防老。

当然,我们要一边自己亲自实践赡养老人,一边反对御用砖家鼓吹养儿防老。道理你懂的,我不扯了,扯多了又要站在 我的伟大祖国的 人民的对立面了。

Update: 接受我的伟大祖国的一些网友的批评,为避免伤害我的伟大祖国的人民的感情,将贵国改成了红色的 我的伟大祖国

Scheme 语言是怎么来的 -1

导言

Scheme 是 LISP 的一个方言(dialect)。著名的 SICP 书就是以 Scheme 为教学语言(实际上 SICP 的作者就是 Scheme 的作者)。 虽然 Scheme 本身只是一个精简化的适合教学的语言,可它首先提出的一些重要的思想,引领了新一代的LISP语言的出现。 实际上, LISP 语言发展的历史是连续的,之所以我在这里人为的把 LISP 的发展史划分为上一代和现代,是因为随着 Scheme 首次引入并规范化了一些重要概念, LISP 语言出现了很多以前从来没有大规模普及的新特性。以 Common LISP 为代表的 LISP 语言也因为这些新特性,而焕发了第二春。 人所共知的 Paul Graham 大叔,借着这一波 LISP 复兴的浪潮,不光写出了 On Lisp 这样的好书;而且还用 Common LISP 写出了一个在线电子商务平台,在 1998 年的时候以近 5 千万美元的价格卖给了 Yahoo! (凭借这笔买卖, Paul 大叔现在经营着 Y Combinator 天使投资,成为硅谷著名的天使)。前段时间卖给 Google 的 ITA,负担着世界上大部分的航班资讯查询,核心系统也是 Common LISP。 虽然不该把 Common LISP 的很多成就全部归结到 Scheme, 但 Scheme 作为一个重要的历史分水岭,探究一下它的历史来源还是很有趣的。

函数作为一级对象

我们都知道 LISP 是一个函数式的编程语言。在 LISP 中,函数是一种基本类型。 类比的看,C 家族的语言中,整数是一个基本的类型,所以,整数类型的变量既可以作为参数传递给一个函数,也可以作为返回值返回。比如,两个整数求和这个函数,用 C 家族的语法就是

int add(int a, int b);

因为在 LISP 里面,函数也成了基本类型。如果我们有一个 add 函数如下:

(define (add x y) (+ x y))

显然,它在 LISP 里就和 C 里的 int 一样,能够作为参数传递给其他函数。

函数作为参数在 LISP 里非常普遍。 我们知道著名的 APPLY MAP 和 REDUCE 这三个“高阶”函数(所谓高阶的意义就是参数可以是函数)。其中 APPLY 的最基本形式可以带两个参数,第一个参数是函数,第二个参数是一个列表。APPLY 的效果就是把这个 列表 作为参数表,送给第一个参数所代表的函数求值。如果我们在 LISP 里面用 APPLY(add, (1, 2)) 结果就是3,即把 (1,2) 送给add 作为参数,结果自然是 3。 这是函数作为参数的例子,还有函数作为返回值的例子就不一一列举了。

自由变量的幽灵

在 add 这个函数的定义中我们可以看到,它的结果和两个输入值 x, y 有关。 如果我们用 add(1,2) 调用  add 函数, 我们至少期望变量 x 会被赋值为 1, 变量 y 被赋值为 2。而结果 (+ x y) 则相应的为 3。 在这个简单的例子中, 显然,如果 x 和 y 有一个值不知道的话, (+ x y) 的计算就无法完成。我们暂且把这些对函数求值不可缺少的变量称之为“必要变量”。显然,这些必要变量的值是需要确定的,否则函数无法进行求值。在我们 add 函数的例子里,x, y 这两个变量既是全部的必要变量,又是这个函数的参数,所以这个函数的结果就完全由输入的 x, y 的值确定。可以想象,任何一个像 add这样的所有的必要变量都是来自于输入参数的函数,不论在什么地方
被调用,只要输入的参数值一样,输出的结果必然一样。

如果现实中所有的函数都有上面的性质的话,那就没有这篇文章了。可惜的是我们很快发现有好多函数不符合上面我们说的“输入的参数值一样,输出的结果必然一样”这个结论。我们甚至无须用 LISP 里面的例子来说明这一点。用 C 语言的都知道,取系统当前时间的函数 time,以及取随机数的函数 rand, 都是不需要输入值(0个输入参数)。因此任何时候这两个函数被调用的时候,我们都可以认为输入值一样(为 void 或 null)。但我们在不同的时间调用 time 或者多次调用 rand,很显然可以知道他们输出的结果不可能每次一样。

函数式编程里面有更多的类似的例子。这些例子说明了的确有些函数,对于同样的输入值,能够得到不同的结果。这就很显然的表明,这些函数的必要变量中,有些不是函数的输入参数或者内部变量。我们把这些变量,叫做自由变量(free variable) [相反的那些被成为受限变量(bounded variable)]。这里的自由和受限,都是相对函数讲的,以变量的取值是不是由函数本身决定来划分的。

虽然自由和受限变量是函数式语言里面的概念,但在命令式语言中也有影子。比方说,C 语言中,函数中用到的全局变量就是自由变量;在 Java 程序中,匿名内部类里面的方法可以用到所在外部类中的成员变量或者所在方法里标记为 final 的那些变量。这些可以被内部类的方法访问的,又不在内部类方法的参数表里面的变量都是自由变量。乐意翻看 GNU C Library 的好奇读者会看到,GNU libc 中的 rand 函数就用到了一个 random_data 的变量作为自由变量 (glibc/stdlib/random.c)。 time 也是一样,通过一个系统调用来设置时间,而这在原理上等价于用到一个叫做”当前时间”的自由变量 (glibc/stdlib/time/time.c)。

我们知道,在高级语言里面仅仅设计或者加入一个特性不难,难的是让所有的特性能协调一致的工作。比方说 Java 语言假设一切均为为对象,容器类型也假设装着对象,但是 int 类型却不是对象,让无数程序员为装箱拆箱大汗淋漓。 回到 LISP, 当函数允许自由变量,函数有能够被作为参数传来传去的时候,自由变量的幽灵就随着函数作为参数传递而在程序各处游荡。这就带来了两个问题,一个涉及到自由变量的值的确定机制,另一个涉及到这个机制的实现。


两种作用域

为了说明自由变量的幽灵和作用域,我们还是从一个例子入手。假设我们要一个做加 n 的函数。为了体现出自由变量,我们把它写成

(define (addn s) ( lambda x (+ x s)))

这个函数本身没什么特别的:输入一个 s, 输出一个 对任意 x 返回 x+s 的函数。注意到这个函数的“返回值”是一个函数。 基于这个 addn 函数,我们可以定义 +1 函数 add1 函数如下,


(define (add1 s) ((addn 1) s))

这个也很好解释,如果输入一个 s, (addn 1) 返回了一个加一函数,这个函数作用在 s 上,即可得到 s+1。一切看上去很顺利,直到我们用一个Scheme 出现前的 LISP 解析器去计算 (add1 4)。 我们期望得到的值是 5, 而它给你的值可能是 8。怎么回事?

为了解释这个 8 的来源,我们可以模拟一下一个基于栈的解释器的工作过程。(add1 4) 调用首先将参数 s 赋值为 4 然后,展开 add1 函数,即将 s=4 压栈,计算 (addn 1)。在调用 addn 时。s 又作为了 addn 的形式参数。因此,按照基于栈的解释器的标准做法,我们在一个新的活动窗口中将 s =1 压栈。addn 这个函数返回的是一个 “lambda x (+ x s)” 的函数,其中 s 是自由变量。 然而一旦 addn 返回,栈中的 s=1 就会被弹出。当我们把这个返回了的 lambda 表达式作用到 4 上求值时候,x 是这个 lambda 表达式传入的形式参数,赋值为 4,栈里面的 s 的值 只有 s=4, 因此 (+ x s) 得到的是 8。

这显然不是我们想要的。总结这个结果错了的原因,是因为我们的解释器没有限定 lambda x (+ x s) 里面的自由变量 s 为 1。 而是在计算这个 lambda 表达式的时候才去查找这个自由变量的值。 自由变量的幽灵在函数上开了一个后门,而我们没有在我们想要的地方堵上它,让它在函数真正求值的时候泄漏出来。

我们不是第一个发现这个问题的人。 实际上, LISP 刚出来没多久,就有人向 LISP 的发明人 John McCarthy 报告了这个 “BUG”。 John 也认为这是一个小 BUG,就把球踢给了当时写 LISP 实现的 Steve Russell。此人我之前的文章介绍过,乃是一个水平很高的程序猿(Code Monkey)。他认识到,这个问题的来源,在于返回的 lambda 表达式失去了不应该失去的确定它自由变量值的环境信息,在求值的时候,这些环境信息应该跟着这个 lambda 表达式一起。这样才能保证没有这个 BUG。不过 lambda 表达式在 LISP 语言中已经成型了,所以他就引入了一个新叫做 FUNCTION 的修饰符。作为参数的 lambda 表达式或函数要改写成 (FUNCTION lambda) 。 这样,这个 lambda 表达式在被 eval 解析的时候就会被标记成 FUNARG,并且静态绑定到解析时所在环境。而用 APPLY 对函数求值时,有 FUNARG 标签的函数会在当时绑定的环境中求值,而不是在当前环境中求值。自由变量没有到处乱跑,而是被限制在了当时绑定的环境里面。 Russell 的这个巧妙设计,成功关闭了自由变量在函数上开的口。这种加上了环境的函数就既能够被四处传递,而不需要担心自由变量的幽灵到处乱串。 这个东西,后来就被称为“闭包”。Russell 用 FUNCTION,以用一种“装饰”的方式,在 LISP 1.5 中第一次引入和实现和闭包。

在编程语言的术语中,上面的让自由变量自由自在的在运行时赋值的机制,一般叫做动态作用域(dynamic scope),而让函数和确定自由变量值在解析时静态绑定的机制,一般称之为静态作用域(static dynamic scope)。既然是静态绑定的环境是解析的时候确定的,而解析器是逐行解析程序的,所以,静态作用域的环境是完全由程序代码的结构确定的。因此有时候静态作用域又被等价的称为“文法作用域”(lexical scope)。上面我们的例子里。我们的真正意图是使用静态作用域,却遇到了一个使用动态作用域的 LISP 解析器,因此出现了 (add1 4) 等于 8 的错误。 但这个问题并不足以说明静态作用域一定好。动态作用域的问题,关键在于违反了 Alpha 变换原则和封装原则,不过不在此详细展开了。

后续的几小节提要

著名的 FUNARG 问题


Actor 计算模型的启示


LISP 也面向对象?


编译,编译,优化,优化

30 comments

NPR简介

不论在美国的什么地方,只要你有一部收音机,调到一个电台,就立即能够深刻了解世界和社会。 这个电台,就是大名鼎鼎的NPR,美国国家广播电台。

和美国之音这样更多的负责外宣和价值观输出的电台不一样的是,NPR 就是为了教育美国公众而设立的。这个非盈利的电台不播送任何广告. NPR 的节目每个都质量上乘,有极强的知识性。正是如此, NPR 的听众相对教育程度较高。去年有本讽刺搞笑的书叫做《白人喜欢的东东》(Stuff White People Like), 调侃中产阶级白人的各种喜好, NPR 就是其中一样。比尔克林顿这哥们不止一次表示喜欢 NPR。 当年创立麦当劳的亿万富翁的遗孀,更是把所有遗产捐献给NPR基金会. 美国人的确喜欢听 NPR, 每年听众给NPR的捐款,占到NPR所有收入的一半。
对于大部分这篇文章的读者来说,NPR 可以作为一个非常好的英语学习工具。如果你在美国,那么可以免费听到最新鲜的英语,而且一点不需要专门花时间去听,只要闲暇时候带上收音机就行了。我练习发音的方法就是每天开车的时候跟读 NPR。 如果你不在美国也不要紧,NPR 的大部分节目都是可以在 iTunes 里面免费下载的(如果你到 iTunes 的 Podcast 的新闻、咨询分类里面,就会看到NPR的podcast 的流行度永远是前几名)。

我个人喜欢 NPR 的两个节目,一个叫 Wait wait… don’t tell me, 另一个是 Car Talk. 这两个节目都是搞笑见长。 前者是把每周新闻拿过来考打电话进来的听众,后者是两个兄弟解答听众的关于汽车的问题。 其中,Wait wait 可以说集成了美国文化的各个方面,有简单的名人访谈,有所有的美式幽默,有对政治和社会新闻的插科打诨。基本上 Wait wait 能听懂每个笑话的话,对美国社会和文化就有非常深刻的理解了。而一般的名人,都以上NPR 的 Wait wait 为荣。比如 Steven Chu 就说,他虽然是所有兄弟中最不聪明的,可他是第一个上 Wait wait 的。Car talk 则更加搞笑。表面上是一个解答车辆故障的节目,但两位MIT毕业的汽车修理工愣是把这个节目做成了NPR最受欢迎的节目,也让这两个人成为了美国文化的一部分。迪斯尼的电影汽车总动员,就把两兄弟请过去为那个锈迹斑斑的拖车和面包车配音。NASA 的 JPL (喷气动力实验室)的科学家甚至不止一次给他们打电话一起搞笑,有一次问的问题是“我们有个交通工具将要度过一个漫长的冬季,请问我们怎么准备”,结果搞笑了一阵子才知道他们问的是火星车怎么度过火星漫长的冬季。除了这些搞笑之外,Car talk 的确还能帮你学到汽车的一些基本知识,了解莫名其妙的疑难杂症。

除了这两个节目, All things considered 是一个非常好的新闻综述,Science Friday 是一个质量上乘的科普节目(常常采访一线科学家)等等,反正我打开收音机从来没有失望过。即使你不在美国,只要有 iTunes 就可以免费下载到大部分优质节目的 PodCast,所以一定不要错过 NPR。

(写这篇文章的初衷是因为路金波先说“杀孩子的杀了喂狗”,然后连岳评论说这是主张“放弃程序正义”。我觉得这个评价太扯淡了,所以展开来说几句。我在这里说的,都是一些基本的常识,而不是什么深奥的东西。以下所有的都是基于美国宪法)

言论自由(Freedom of speech) 这个概念是美国宪法第一修正案界定的,以前我写过很多次文章介绍了。宪法第一修正案的第一句话是“国会不得立法以:确立国教或禁止信教自由;剥夺言论自由或出版自由;或剥夺人民和平集会和向政府请愿伸冤的权利。” 我们常常说的言论自由,就是来自于此。

正当法律程序(Due process) 这个词,则是美国宪法第五,第十四修正案界定的。其中第五修正案是限制联邦政府权利的,原文如下:“非经大陪审团提起公诉,人民不应受判处死罪或会因重罪而被剥夺部分公权之审判;惟于战争或社会动乱时期中,正在服役的陆海军或民兵中发生的案件,不在此例;人民不得为同一罪行而两次被置于危及生命或肢体之处境;不得被强迫在任何刑事案件中自证其罪,不得不经过适当法律程序而被剥夺生命、自由或财产;人民私有产业,如无合理赔偿,不得被征为公用。”其中,第四款中的“适当法律程序”,就是 Due Process of law 的中文翻译。南北战争之后,国会深感如果不用同样的条文限制州,州也会违反“正当法律程序”,因此,宪法添加了第十四修正案。这个历史和判例,我以前曾经专门写过。如果我们看到第五,第十四修正案,就会很明白,一般法里面所谓的 Due Process, 仅是对联邦和州政府的执法者,如联邦和州的法官,检察官,警察等人群提出的要求。 正当法律程序的一个重要的实现手段,就是程序正义(Procedural due process)。
这可以看成是一个弱化的对正义结果的追求:因为程序正义是最可能达成事实正义的方法,而事实正义本身如何界定争议太大,我们至少先要保障程序正义。不管怎样,Due Process 以及程序正义作为法律上的术语,提的要求是仅限于对政府,而不针对公民的。这一点也很好理解,公民本身没有执法权(如果公民非要说有而执行私刑 Lynching,自然有其他法律定罪,因为这时候已经侵害了他人的基本人权。),所以不能用程序正义来要求公民。这个基本的概念如果不清楚,所有的后面关于程序正义的讨论就没有意义。

程序正义的法理学基础,来自政府应该相信,每个公民都是应该受到尊重的。 当然,这并不蕴含着每一个公民都要相信其他的公民应该受到尊重,正是因为这里面有巨大的鸿沟,所以常常成为辩论的引爆点。比如一个人冲击幼儿园,杀死了12个没有任何防卫能力的小朋友,自然地,出于人性,其他公民就不可能对其表示尊重,甚至有复仇和主持正义的心态,说出如“凌迟一百次”这样的话来。 那么,现在的问题就是,说出凌迟100次这样话的这个公民,是不是影响,或者在反对程序正义。

这里面其实有三个层面的考量。 第一,愤怒驱使下的言论受不受言论自由保护? 第二,公民的言论会不会影响程序正义? 第三,为了程序正义,是不是我们要放弃一部分言论自由。

我们先看第一个。 以前看过我写的第一修正案和相关判例的人都知道,在美国愤怒到烧国旗都是受宪法保护的。 一个言论受不受保护,不是看言论内容是不是合乎大众品味,而是看这个言论能不能导致明显而立即的危险。 如果某种言论能够立即导致危险,那么为了防备这种危险,我们要限制这个言论。 所幸的是,美国最高法院常常发现,所谓的危险常常不存在,所以判决了无数偏向于保护言论自由的判例。 以说出凌迟 100 次这个言论为例。如果这个人不是陪审团的,也不是法官,那这个言论是根本无法造成任何危险的,因为犯罪嫌疑人被严密的看管着,况且你我大家都知道,路金波和看到这句话的人都清楚,他们是不会拿把小刀去凌迟的。因此,这种言论,尽管看上去不理智,不那么深刻,但它的确的确是应该受到言论自由保护的。 这一点,相信大家异议较少,因为路金波也的确表达了,也的确没有人去限制他表达。

关键是第二点。上面我们说了,美国宪法的在程序正义,是用来要求联邦和州,在司法案件中对待公民(其实也包括企业)上的一般原则。 那么,假使一个人,反复的渲染和帮助法律审判中的一方,会不会破坏程序正义呢? 事实上不会。 原因有两个。第一,程序正义强调的是程序,而不是正义本身。程序包括采集证据,法庭辩论等等,是有成文的规定的。在法制健全的国家,是任何言论也没法改变的。最著名的例子就是辛普森杀妻案件了。 媒体和大部分美国人都倾向于他杀了人,可是程序正义依然毫无影响。如果司法机构被影响了,那么只能证明该司法机构不合格。公民和媒体没有任何责任(事实上也不可能)去呵护司法机构维护程序正义,因为这本身就不是公民和媒体的义务。

第三点更加深刻。 有人担心,媒体和公民如此“煽动”,恐怕有不好的结果发生,所以最好要让他们理智一点,避免影响司法公正,所以,最好要限制这种言论自由。 事实上,言论自由正是程序正义的一个保障。历史告诉我们,如果律师不能说话,如果受害人老是被雪藏,如果没有言论自由,就根本没法有程序正义所要求的公正采集证据,寻访证人,也不可能有正当的法庭辩论。 为了程序正义,我们至少不能限制言论自由。 当然有人要说了,我们可以放开这一类的自由,但是限制那些“煽动”的言论自由。 这个提议看起来很好,也符合很多“理智主义”者的想法。事实上,这是大错特错。 美国宪法的立法者早就意识到,如果你限制了一种言论自由而放开另一种言论自由,那这就不是言论自由了。 那些希望用程序正义这个光亮的果子来诱使人民相信必须要限制不理智的,煽动仇恨的,会影响司法公正的人,充满了理性优越感的想要通过正义而理智的立法限制言论自由的时候,却惊讶的发现碰到了永远越不过的石头墙:宪法第一修正案赫然写着“国会不得立法限制言论自由”。 其实这不值得惊讶,美国的开国先贤知道后来的理智的聪明人会这么干,所以早就把你要走的路堵死了!

再说一次废话:我写的这些东西,都是基本到不能再基本的,每一个美国中学生都熟悉的宪法知识。我也是只读了一些基础的书,可见要掌握这些基本概念不难。我希望我的读者能够读一些这样的关于公民权利和第一修正案的书,你读了这些书以后,就知道我在这里写的都是废话。你要是真的觉得我写的全是你已经知道的废话,我反而会很高兴,因为你已经成为一个值得我尊敬的公民了。 如果你还年轻,想成为一个正直的人,那么,了解什么是自己的自由,什么是他人的自由很重要,因为这样你就不会有意无意的侵害他人自由而不自知。其实人际关系中,正直的基本定义就是如此。哦,对了,我只和正直的人成为朋友,因为不正直的人侵害我的私利的概率比较大,请原谅我的自私。

12 comments

Borg

Star trek 是基本上属于 Geek 必看的科幻剧了,虽然年代久远了一点,但里面很多词和符号都成了 Geek 文化的一部分。
我甚至怀疑乔布斯老师是按照 Star trek 里面人手一个 PADD 的创意发明 iPad 的。

Startrek 剧集中塑造了一个外星种族,叫做 Borg. 我觉得很有意思,来八卦一下。

首先,Borg 这个种族常常和邪恶帝国挂上等号。如果你去翻 New Hacker’s Dictionary 的 Borg 条目, 他就会告诉你, See also: Evil Empire. 如果你是 geek 网站 slashdot 的常客,你就会发现, 上面每条微软的新闻旁边,都是比尔盖茨同学戴了一个机械状的头盔/帽子, 是的, 这就是隐喻了比尔盖茨的微软是个邪恶帝国。

为什么说 Borg 是邪恶帝国呢? 这要从 Borg 的生存方式说起。 所有的 Borg 成员,都随时听从一个中央命令机构,叫做 Collective (集体). 这个集体, 随时能够和任何一个 Borg 成员通信, 在 Borg 成员里共享一切信息. 每一个 Borg 成员并没有名字,而是以代号相称, 比如第一联合方阵第一分队 9 人组第 7 号(著名的 Seven of nine)。 这些成员也没有任何所谓的个人意志,都是属于 Borg 集体里的一个工蜂而已。

Borg 本身只是一种社会组织方式,蜜蜂和蚂蚁基本上也是这样组织的。 Borg 的邪恶之处在于,他生存的唯一目标,就是不断的同化其他的种族,以达到自身种族的完美。 他们对其他种族的同化显然非其他种族自愿的,于是他们就不断的发动战争,其中就包括对人类的战争。 同时,他们的武器系统还很发达,能够自动适应对手的武器系统,所以基本上同化其他种族好不费力气。 Startrek 剧集放到 Voyager 的时候,他们基本上已经统治了银河系第四象限的绝大多数星球系统了。 一个种族一旦被同化,就彻底变成了 Borg 集体里面的一个零件,所以,Borg 几乎是所有其他种族的敌人。

Borg 同化的方法也很神奇,就是给你注射一种纳米级别的生物芯片,这种生物芯片一旦到了被同化的生物的体内,就开始改造这个生物。 以人类为例,Borg 认为人的视觉系统不够发达,所以同化人类为 Borg 的时候,人就会被添加一个发红光的眼睛部件。 Borg 的这个特征很显著,盖茨大叔的图就是这么回事。

Borg 这种集中的,集体的,一致对外的组织方式,是效率无比之高的。 当然,Borg 也有一个致命的弱点: 他们的技术非要通过同化其他生物才能获得,他们本身的研发技术却不见得怎么样。用句流行的话说就是 “一直在模仿,从来不创新”。 所以假如遇到不能同化的生物,他们就非常郁闷。比如说,Borg 编号为 8472 的生物的免疫系统特别强, Borg 的生化武器完全不起作用,这时候 Borg 就被打得落花流水。 最后还是靠英勇的人类船长和神奇的医生研发的技术才勉强打败了 8472 号生物的一次进攻。

Star trek 中有多次 Borg 的成员被同化后脱离了组织再次变成一个个体的例子。 最显著的就是 Seven of Nine 的去 Borg 过程了。 Seven 是一个人,很小的时候就被同化成 Borg, 一开始是作为合作来到 Voyager 船上的,但是时刻不忘和集体保持联系。因为一次事故,她和集体的连接被切断了,她立即感觉到“我再也听不到集体的声音了,我很孤独”。 的确,Borg 集体的力量和声音是非常有安全感的,一瞬间失去了之后必然会感到很孤独。 船长 Janeway 就说,你不是 Borg, 你首先是一个人,不要感到孤独,我们船上所有的人都是你的朋友。 Seven 最终摆脱了 Borg 集体的影响,成了 Startrek 系列中最性感的角色,哈哈。

最后附送一个和 Borg 有关的好玩的技术八卦。 大家都知道 GoF 的 Design Pattern 里面的 Singleton Pattern, 就是一个类只能有一个实例。 在 C++ 等标准的静态语言上,实现方法是私有化构造函数等等。 在 Python 这种藏不住构造函数又动态的语言中,
实现 Singleton 看上去是比较麻烦的。 不过,有一个叫做 Borg Pattern 的实现,优雅得实现了 Singleton。 如果你了解了 Borg 种族的特点,又知道 Python 的一些基本知识, 你看下面的这个代码肯定会赞叹到笑出来。

class Borg:
    __collective_mind = {}
    def __init__(self):
        self.__dict__ = self.__collective_mind

    # and whatever else you want in your class -- that's all!

Borg Pattern 就这么简单。对于小项目中顺手写一些控制资源访问的 Singleton 来说,这个 Borg Pattern 实在是不能再好了。

设计新语 (new speak) 这种语言的目的,不仅仅是一种适合表达 Ingsoc 的世界观和思维习惯的媒介,更加要紧的是,其他的思维方式根本无法在新语下表达。 — George Orwell  “1984

语言是能够影响思维的,这一点基本上对语言和思维有认识的人都能够体会到。

一、

亚马逊丛林里面有个部落,语言中没有数字的概念,因此,当地说这个语言的人只能够分辨两框苹果哪个多哪个少,却不能数出这框苹果比那框苹果多多少。非洲也有一个部落,语言里面没有左和右的概念,只有东南西北。他们也就没有“右手”这个词,只能根据身体的朝向说你“东边的手”或者“西边的手”等等。因此当地人方向感特别强,到什么地方先要分清楚东南西北,否则没法表达一些意思。

阿拉伯人常常和骆驼打交道,因此有几十个关于大骆驼小骆驼公骆驼母骆驼等等的不同的词。 爱斯基摩人天天出门见雪,因此有地上蓬松的雪,结了冰的雪,刚下的雪,屋子上的雪等等十几个不同的词。假如他们看到一副画,就要先思考这个画里面的骆驼或者雪是什么属性的,如果不知道属性(比如卡通画里面的骆驼或者雪),他们就不知道怎么说才好。这些都是语言对思维的限制的例子。

语言对思维还有一种误导的作用。比如我们小时候常常听说的一个词叫做“早恋”。这个词在中文里面包含了偏见,好像是本来不应该的,提早了的恋情。这个词本身表达的概念应该是中性的(英文里这个词叫做 puppy love, 小猫小狗之间的恋情,媒体和大众对这种现象都是中性态度),但是中文表达出来,却包含了一种价值判断(“早”字包含了不应该的意思)。 中文中有无数这样不科学的,包含了偏见和价值判断的词(这些词被李笑来老师称为恶词)。任何一个想要独立思考的人都应该避免使用这些恶词。

二、

我们说了语言能够影响思维,那么语言是不是决定了思维呢? 这就是著名的 Sapir-Whorf 猜想。 这个猜想是说,语言对思维是有决定性影响的,即存在这样的一个语言,使得某种意思能够在这个语言中得到表达,但不见得在另外的一个语言中得到表达。 假如说 Sapir-Whorf 真的能够成立的话,那么 1984 和新语真的不是痴人说梦。

三、

所幸的是,很简单可以证明 Sapir-Whorf 猜想不正确。 大家都知道,计算机语言是一种非常受限的语言,然而只要这个语言是“图灵完全“的,他们在最根本的表达能力上都是没有区别的。乔姆斯基更加猜想,人的语言的生成机制,就是一个图灵机。 这个猜想其实和丘奇-图灵论题是等价的。 我在之前一些文章中提到的,人工智能的符号学派假设人的思维完全来自于对符号的处理,根据丘奇图灵论题,那么只要一种语言能够容纳图灵机,就能容纳其他语言了。 我们常用的自然语言是显然能容纳图灵机的, 因此,理论上来说,只要语言足够复杂,就不大可能完全决定我们的思维,使得一种语言能表达的意思完全不能由另一种语言表达。当然,不同的表达有效率的问题,因此即使本质等价,从效用上看也不等价。

四、

中文中唐诗宋词的结构之美,是其他基于字母的语言难以企及的,所以,审美是和语言息息相关的。 Python 编程中的美,函数式编程中的美,也是 FORTRAN 所未能得见的。 中文的美一定程度上来自于其搭配的模糊性和意象类比,读多了唐诗,宋词的人就知道,几乎没有一个没有类比的。 这种意象类比在文学作品中出现是一种优美的事情,但在非文学作品中,在评论,科学写作和日常交流中,这往往是正确思维的敌人。 这在一本叫做 The Alphabet Effect 的书中讲得很仔细。

英国科学家李约瑟毕生研究中国科技史,他很好奇,古代中国拥有世界上最先进的技术和生产水平,为什么却没有发展出现代科学呢? 到底是中国古代社会哪一方面出了问题呢? 这个“李约瑟问题”的答案有很多种,其中 The Alphabet Effect 这本书就提出了一种解释: 中国的书写系统不是字母化的,而是方块字。 或者简单的说,就是全怪仓颉这个人,怎么不造出拼写文字?

大体说来,此书认为,第一,中文读,写系统分离(看到,听到一个字不知道怎么写)使得阅读中文的时候较多的采用非线性(右脑)思维,而人在进行逻辑思考的时候较多的是左脑思维。两脑并用不是优势,所以中文书写系统影响了左脑的发展。 这一点我不知道对错。 第二点说,中文的字,都是从具体的图画而来,而中文的词,都是单字组合而来,这些单字组合,又必须要尊重原来具体单字的含义;加上单字又是抽象了具体的,可以画出来的事物,所以中文的抽象程度不高,且一词多义现象非常严重。 而现代科学需要的是高度抽象的词,和高度精确的概念。这一点我是同意的。现代汉语里很多词,在新文化运动前是没有的,比如“科学”,“哲学”,“政府” 等等。古希腊的拼写文字组合灵活,很早就形成了如“质”,“量”,“比率”,“几何学”,“心理学”等等和现代科学相关的,抽象程度很高的词,而这些概念则是古代汉语中从来没见到过的。第三,活字印刷术虽然号称是中国发明的,但其实一直没有大规模使用,在清代还是雕版为主。而普遍采用字母的欧洲则迅速采用了活字技术,使得雕版技术只在高档场合有所保留。 这一来更加拉大了信息传播的差距。

五、

俗话说,人穷不能怪父母,用批评中文本身的方法来掩饰在科学上的落后只是一种学说而已。 如果现代汉语和其他语言处于同一起跑线的话,本应当有足够的机会弥补这个缺口。 不过,英语已经成为一种事实上的语言了,所有的新的概念和新的学说,基本上都是以英语发表。作科研的人做到后来也知道,有些概念不知道怎么翻译成中文(而且一翻译就是错的,比如俄狄浦斯情节,翻译成中文叫做恋母情节,其实完全是把一个好词翻译成了恶词,抽象程度大大降低)。 我一直鼓吹,如果要学习计算机科学的话, 会英语的人能看英文就少看中文,因为中文中,对计算机科学中相关概念的精确程度的确比不上英文,而且一翻译就错。

英文 wikipedia 有几百万个词,而中文只有十万个,撇去因为审查制度造成的不便外,英文比中文的复杂度是在高太多了。(从这个意义上来说,审查制度是不是在扼杀中文?)
六、

语言是一种媒介,不光是语言能影响人的思维方式,物理媒介本身也能影响人的思维方式。 你是否曾经觉得在多媒体计算机屏幕前看书怎么也看不下去,一换到纸质的书就能看下去? 是否觉得小时候爱看电视的人长大了思维不连续,没逻辑? 是的,媒介会构建和摧毁你的思维方式。 多媒体计算机有很多的视觉元素,会抑制你的左脑的线性思维,激化你右脑的模式识别能力,所以,在多媒体计算机前看书的你,会自觉不自觉的被转换到右脑的思维方式,看电视也一样。 这是无法避免的事情。 科学研究发现,儿童看很多电视会影响后天的智商和持续思维能力,因为电视屏幕平均每隔90秒就要换一次场景,儿童的大脑就会发展为适应这样的持续激励的右脑思维方式,而左脑得不到必要的训练。

想买 iPad 看书的同志们,可要想好了你买了 iPad 之后大脑是不是会和你作对不让你看书哦 :) 如果你常常用 iPad 看电影上网的话,看书可能是一件让大脑感到困难的事情 :)

我的 wordpress 的 index.php 文件总是在最后莫名其妙的出现 一个 iframe, 里面有 http://www.kmsjwg.***com****/x*******x.htm 昨天晚上我检查的时候还没有,今天就已经被举报成恶意站点了。

我怀疑是博客哪个地方有漏洞,目前正在修复。 哪位有线索也可提供。

谢谢阅读