Apr 18, 2007 - 十年数海拾贝路

Comments

最近我的RSS上几乎同时出现了好几篇要学习数学的文章,而且都是非常牛的计算机高手写的决心要学习数学的,不禁唏嘘。我在数学系的时候,其实并没有好好学数学,只想保持个 GPA , 空余时间就全部躲图书馆了。每次拿计算机书都要经过数学书架,我对那些书一直视而不见,假装我是计算机系的学生… 在美国所有的大学同学中,就我一个人叛逃数学,所以每次我见到他们都不好意思,他们说的那些概念,我的脑袋已经不能处理了;况且是数学系出身,知道这个水的深度,一点也不敢去淌。虽然现在不搞数学了,回来想想,数学这个东西啊,真的很有用,仔细一算,我在数学的海滩上已经走了十年,偶尔捡到或美丽或平凡的贝壳还欣欣然。虽然我已经从数学这条路上叛逃了,对数学还是深刻的爱着,好像是对青梅竹马的幼时玩伴一样的爱着.

真正接触数学,是四年级升五年级的暑假。我在家无聊,开始翻我爸爸的书橱。小孩子总是幻想着书中有一条牵牛花小径,每朵花上都停着一只蓝色的蜻蜓(王小波语)。 我也这样希望。于是,我翻开一本书,叫做《平面几何一题多解》. 那是我手能抓到的最薄封面最好看的书–蓝色封面,上面一个圆,一个三角形。这个奇怪的书讲的啥呢,我很好奇。翻看来,每个汉字都认识,每个符号都不懂。于是我问我爸,这个书讲的啥啊,从来没见过这个天书啊。我爸爸对我说,这个东西呢,叫几何云云,你想不想学呢。我说,想啊。其实我只想知道这个书讲的是什么,远没想到,这个一个决定,让我此后人生轨迹和数学打上了交道。

于是,从五年级开始,我拿着一本粉碎四人帮后编写的一本《数理化自学丛书:平面几何》开始自学,这套书共17册,好评如潮。我父亲买书那时侯高中毕业在农村做会计,想要学点东西,于是就买了这套书。不过后来他考了师范,上了大学(学的是中文…),这书就一直没用过了,现在我学,也算是对当年他一个月工资买的这套书有个报答。 好吧,平时一周做八道题,假期就一天八道题,然后不会的问他。慢慢的,居然做了8个大本大约10厘米厚的习题解,把两千多道平面几何题在小学毕业前干掉了。显然的,我整个初中高中大学,就和数学有了不解的情缘。

后来小学毕业的时候我们县有一个初中强化班招生,我碰运气考上了,靠的就是数学几乎满分。不过我爸说,你考上归考上,一来年龄太小,二来你身体不好,还是不要去上了。于是,我留在我爸学校读初中,一心要考我们市最好的高中,比我没去上的县中学还要好的,这样我才不会觉得亏。 于是,照例是数学作为重点突破口,搞奥赛,搞难题。其实现在想起来,那时候就被应试教育给打上了深刻的烙印,如果我不搞这些,我就考不上高中,如果我做我喜欢的事情,比如去看文学名著,我又会是另一个样子了。后来如愿以偿,终于考上了, 所以这条路,看来也是对的 :)

高中是我最不得志,但是最自由最感谢的地方。为什么这么说呢,因为强人太多了,我每次考试都是班上7,8名,和初中不认真也能骗个年级第一形成非常强烈的反差。 不过扬州中学有一个教育哲学,就是如果这个小孩名次一直稳定,基本没人管你。所以,如果不想名次提前的事情,就很自由。我除了上课,就去图书馆。如我所说,我们学校的图书馆里面还有很多大学书,特别是理科的数学的书,比如实变函数,点集拓扑。好么,高年级数学系本科生的课本都流落到高中图书馆了,哪有不看一看的道理呢。于是,我就把这些书囫囵吞枣全看了一个饱,只记得数学分析看到曲面积分就不懂了,反正没压力,扔了不看就是了。那时侯我们班上有几个好手,搞竞赛暗自都比着的,你看了他不能不看,于是这样,我们几个搞竞赛的把多元微分,复变函数和离散数学组合数学都看了,我还看了初等数论和射影几何和群论。那时侯不知道这些其实搞竞赛没用,只希望能拓宽视野,用高等数学方法解中等数学问题。后来集训的时候,我们班上一个哥们做题,上来就说 “让我们考虑这个连续函数在实数上的微分”,或者 “让我们考虑在这个变换下的不动置换的数目” 老师看呆了⋯⋯ 后来我们这拨人都竞赛得了奖,大学中又无一例外都是搞数学物理方向的。 高中毕业的时候我做了个有心人,把我借过的书单导出来,294本,其中大学本科数学书69本,也就是说,我平均三天看一本书,一年看23本数学教材…… (其实,很显然的,这种看书方法肯定学不到东西,当年看的书现在的确也全忘记了,所以我现在不推荐也不赞同这么看书。)

然后就是考大学填志愿了。高考我估计自己考的不太理想,所以就想,填个南大吧,靠家。我爸死活要我填信息管理系,我妈更干脆了,说咱填清华吧。在这个问题上,我第一次不同意他们两个人。我说,我高中看过了很多数学书,我填数学系,这样我就有空余时间做其他的了,以后也能想办法转专业,因为那时侯我就喜欢计算机。当然了,现在证明我们家做决策正确度是我妈>我>我爸(我弟弟暂不参与排名). 后来,就填了南大数学。 当然选择这条路,选择南大数学,我不后悔 (要是现在还后悔,那也太没志气了)

大学强人更多了,高考的时候我还碰运气靠作文满分混了个班级第一,大学都就是作文两次满分我也混不到班级前十。有的强人,考不到95分以上就痛苦自责(NYU);有的牛人大一就考GRE (Stanford), 如此牛人太多我备受打击。不过高中的基础在,就算不去上课,也勉强混个80。而且我被强人打击到决定不和他们比数学的田地了。我空余时间就看计算机了,争取在计算机上有突破。现在想起来,至少有两门课没认真学而现在后悔: 统计学和泛函分析。所以现在补啊补,补得我特别吃力。

十年数学路终于在大二时候结束,大三大四做的事情,基本上就和数学没啥关系了,全是计算机的功底在支撑。数学学习铺垫了我这十年的人生轨迹,人家是学而优则仕,我算得上是数学优而擢了。虽然不算精彩,也是有很多触动。数学的确是理科的基础,大厦的基石。这十年一想,我有几个感触想写下来,其实这些感触,以前就总结了,现在拿出来不过是老调重谈了.

第一,数学这个东西,不能像畅销书一样看。数学这个思维方式,是要内化到大脑伴随一生的,所以如果仅仅当做床头书,而不是每天练习,不如不看。用通俗的话说,非下苦功不可。

第二,数学这个东西,要基础牢靠才能往下走。虽然前几天说砍柴不误磨刀功,不过学数学,还是要磨利索点的刀。如果忘了高中数学,就从高中看;忘了大学数学,就从大学看,忘了初中数学,那就从初中看。一步一个脚印,这不丢人。

第三,也要砍柴。一方面是要做题,另一方面是要思考。比如我们做计算机的,如果每次写算法的时候,想着用统计或者组合方法分析一下算法,就算没有啥新意,也能锻炼一下脑筋。我想我的读者大部分都和我一样,不是天才类型,因此勤学苦练是通向成功的必由之路了。

第四,人的一生,自学比学校学习来得重要,如果没有足够的自学能力,一本简单的数学或经济学的入门教材是一个很不错的开始。只有拥有了足够的自学能力后,才能去挑战大学本科数学系的那些课程,比如数学分析,高等代数,拓扑,泛函,统计。这些在实际中都非常非常有用,但是对于普通人的水很深,浅尝只是浪费时间。

PS: 我在豆瓣有两个豆列,一个叫 给学数学人看的计算机书 一个叫 给学计算机人看的数学书。这是两个 “对偶” 的豆列,我正在建设中,大家可以献计献策. 真诚的希望您留下宝贵的意见,无论是在这里,还是在豆瓣。

Apr 17, 2007 - 一切傻X都是自证的

Comments

这次美国发生这么大事情,国内的朋友纷纷问候。我就说咋消息这么快啊,哦,原来是中文媒体都上头条了。而且确定无误的说,是和中国留学生有关。

不就是为了吸引看客可怜的眼球么,就非要把事情往中国头上揽。所有的消息都只有一个来源,芝加哥的一个地方小报,除此外,美国媒体很谨慎,没有一个那样说。倒是国内媒体一窝蜂的全转载,搞得外交部都出来发言否认了,国内媒体还不收手,连Shanghai Daily 都被wiki 引用(wikipedia 以及中文版 这个时候表现出的公正和谨慎让我深感佩服)。 我们中国人出个事情就值得你们这么宣扬么,况且还是流言蜚语。这种意图,到底是傻X还是傻X的平方?

以前王小峰同学骂新浪的时候我还同情一下新浪,现在看来,早点吊销他报道外电的新闻牌照得了,首页新闻可以和mop 媲美了,新浪还是改娱乐路线吧。一切傻X都是自证的,国内媒体再次证明他们的本质。

如果有人想告新浪,我出500RMB, 搞芝加哥太阳报,我出100$, 搞死你们诽谤的傻X.

PS: 已经确认这个事情和中国留学生无关,大家放心。

Apr 16, 2007 - 从A到Z

Comments

今天美国社会发生了一件事情,具体的情况尚未有官方说明,已经有傻X的国内媒体往自己身上惹新闻了,懒得去鄙视了。这件事或许会对很多人的人生,对美国社会产生深远的影响。

人生是多么的脆弱,在灾难面前是多么的无助。晚上回到家,我拿出手机,从A到Z, 给每个人都打了个电话,大家都互相在说,take care (保重). 是的,无论以后人生怎样无常,大家牵着手,互相说保重。

信神的,请祈求神保佑人类;不信神的,请保重好自己和所关心的人.

Apr 14, 2007 - 全局最优

Comments

我们做最优化研究的,最清楚全局优化的难处. 举个通俗的例子,假如你在商场里想买件衣服,或许看到第一眼漂亮的,你就出手了,待会儿发现另一家还有更漂亮的,或者刚出商场门,发现对面的一家小店衣服 漂亮,而且还在打折。你永远选不到最满意的,人生最痛苦的事情莫过于此了。

那么,怎么选择才能尽量满意呢? 显然我们研究优化问题的人不可能不研究这些问题。以前大家都以为计算机科学就是老和计算机打交道的,其实不是。比如说吧,我们计算机领域中有一个有名的例 子,叫做猴子摘桃子问题: 一个猴子跑进桃子林,沿着桃树从进口走到出口,不许回头,只许摘一次桃子,那么,怎么尽量找到大的桃子呢? 计算机科学家研究了这个问题,而且还得到了很好玩的结果。比如说吧,假如知道最大的桃子M和最小的桃子m,我们有一个算法取第一个大于 m*M 平方根的桃子,还可以证明,这个算法是所有非随机的方法中最好的。还有很多计算机科学家研究随机化的算法,当然,这个随机不是说随机取,而是说随机选取一 个 m-M 之间的标准,然后取第一个超过这个标准的。也可以证明任何随机的方法都不超过这个方法的性能。

大家可能觉得你们研究计算机的还真无聊,这个问题有啥意思?猴子又不这样选桃子。不过我要是从研究结论引申出几条人生哲理,或许你就觉得很有意思了。

  1. 我们选择任何东西的时候,最好对这个东西的最大和最小有个估计

  2. 要确定一个选择的标准,一旦选定了标准,就坚持这个标准

  3. 珍惜超过这个标准的第一个,因为人生没有回头路

  4. 人生的随机性反而让人生的选择更好,所以不要害怕命运的变化,反而要感谢这些变化。

最后用袁亚湘院士的一句话结尾,:“进了大学不要着急谈恋爱… 等下届大一新生进来再说 ” 这告诉大家,人生的选择不必太着急,观察好了再出手才能选到更优秀的。 由此可见,研究计算机和数学对人生的还是有一些指导意义的. (袁亚湘院士是最优化研究方向国际知名的专家, 这句话是他的一项研究的通俗说法)

Apr 13, 2007 - 闲话图书馆

Comments

从小到大我就爱泡图书馆。 这个习惯是从高中养成的,直到现在也保持这个习惯。我泡过的学校图书馆包括扬州中学图书馆,南京大学图书馆,北京大学图书馆,还有现在WUSTL的图书馆。 这里随便写几个对这几个图书馆的映象。

扬州中学的图书馆是我最怀恋的图书馆。 或许大家都想像不到,扬州中学图书馆中有两个书架的理科老书,基本涵盖大学理科所有教材。我估计是当年扬大流落过来的,或者是当年我们高中太牛了, 高中生学大学知识。 那些书 都是60年代文革前的,书后面的借书记录密密麻麻。 我常常看着那些记录,想像若干年前是不是也有一个和我一样的人,躲在图书馆的一角,啃着这本书。除了这些理科书,更多的是校友捐赠的书, 那些校友都是知名的企业家,院士等。 我当年看到一套通俗数学名著译丛,就是上海的某个院士校友捐赠的。这套书我在其他图书馆一直没找全过。 扬州中学的图书馆就好像是cygwin, 把一个强大的世界引入了一个本来不强大的系统。当然,玩转cygwin 显然是需要 Linux 基础的,所以当年啃那些书,就和学习cygwin 一样,其实是事倍功半的。不过反过来,相比较于其他高中的图书馆,我们学校的图书馆实在是天堂。要知道,现在有些高中图书馆,彻底不能算图书馆,因为除了教辅书没其他书。我们以前还能借到金庸红楼梦,可想我们高中自由的风气了。

南大图书馆藏书其实不算多,珍本我们也看不到,书很普通,也不多,因此我才立下宏愿要看完几书架。 南大图书馆正书少,小说多。就是因为书少,大家都去看小说了,剩下我们看非小说的就很容易了。正书总在架上等你借,从来没有被人借了要等的情况。南大有很多92年前的书单独分类,在这里我发现我高中的每本老书这里都有,所以一度很高兴。不过上面我提到的通俗数学名著译丛这套书在南大只有两本,真不知 道他们怎么采购的。南大图书馆也有一个缺点,就是难借难用。首先,如老罗定理的推论所说: 每个大学的图书馆都有一个更年期的女人负责,你想问什么情况时候她总是不搭理你, 你不想她打扰的时候她总是烦你;其次,南大分鼓楼和浦口两个校区,好书都在鼓楼,想借需要跨馆手续。 南大几乎每个系都有图书馆,我们系藏书甚多,但只对研究生开放,加上我一心搞计算机,所以我也没去过几次。 南大的图书馆就属于老版本UNIX, 朴实无华, 器钝但坚, 和校训诚朴雄伟相得益彰,既不张扬,也不冒进,全是普通的有用的书,新书和善本都不算很多,但是做日常的事情,这个图书馆也就够了。

北大图书馆是我研究生复试的时候拿前女友学生证混进去自习才熟悉的。不过书没好好看倒是把图书馆的结构摸了个清楚。 北大图书馆书的确多,善本珍本也多。 我那会儿要准备生物考试,其实生物一窍不通,于是想借一本生物化学临阵磨枪。去一看,乖乖,就光是书脊上写了生物化学这四个字书的数目就比我在南大看的所有小说书占的书架还要多。这个是什么概念呢,就是说,依我的看书速度(3天/本快速扫描),假如我真在北大读五年生物信息学研究生,最后结果是生物化学书都没读完,而生物化学其实只是生物学的一个不算大的子学科。不过北大计算机科学方面的书貌似不算多。我这么说第一是因为影印本的书我没发现几本; 第二是我用Knuth为关键字只发现四本书,就是TAOCP和具体数学, 还没南大多呢。其他图灵奖获得者的书北大也很少,因此我怀疑牛X的书全跑计算机系了。 当时我就想啊,什么时候把北大图书馆的计算机书囫囵看完我就牛X了,结果这个愿望实现不了了,所以我到现在也不牛X…… 说了这么多一塔湖图的好话,再说点不好的。北大图书馆我不太喜欢,个人原因是因为我大模大样跑进去看书居然被保安发现我用前女友的卡,罚了我20块钱,心疼啊!不过这当然不是主要的了,主要因为两点,第一,它的索书体系需要学习好长时间才能明白,北大图书馆的确历史深厚,基本没有采用中图分类法,这意味着如果你对国家图书馆很熟悉,去北大找书,肯定撞墙或者撞书架,当然也有小概率撞美女,但你绝对撞不到要找的书。 第二是书架上的书放置顺序比较不讲究,几乎等于我不知道算法的hash表。我找一本书,左右两本相邻编号的书我都发现了,但是这本书硬是要在离他三个书架 远的地方找到。可以想象北大学生找书的时候肯定和众里寻她千百度一样采用O(n)顺序查找而不是O(log n)的折半查找,当然不排除他们采用O(1)的哈希我不知道。如果北大图书馆的书过一个sort 管道或者被Google 爬一次,估计效率会上升很多。 第三是重复书太多太多了,有的书我发现十本甚至更多放一起,我几乎怀疑北大的书过一个uniq 管道,藏书就剩下原来的 1/4 不到了。 当然,这些重复的书还是很有必要的。 如果要打比方,北大图书馆就是CPAN, 超级巨大,精华和不精华的都有,只要你能找,总能找到想要的。当然,你也可以说是以前很流行的wuarchive 里的软件了, 那个库里啥软件都有,啥事都能干,关键是要能找的到。

然后就说到现在学校的图书馆了。显然,分类法是美国分类,我学了好半天才学会(我喜欢把分类表自己记下,直接随机存取,从不问管理员)。我们学校的图书馆 是我见到的迄今分类最科学,我用着最舒服的图书馆了。 首先,想找的书永远在他的位置上,这一点不得不佩服老美的敬业,还有读者的高素质。 其次,因为历史原因,很多书是支持全文检索的,因此我可以很方便找到想要的。 最后,我可以预约借书,也就是说,我只要在网上选好了书,一个小时后直接去拿书,直接刷个卡就行了。当然这也和美国大的学术气氛有关系,在国内你借书是欠学校的,在这里你借书是天经地义的,你借书不爽那是学校欠你的,直接可以提意见,运气好还能奖励你纪念品。现在我们学校的图书馆,好比 Linux, 属于另一个体系,很高效,成本也低。一旦学会了这个体系,你就很喜欢,效率很高。

我也知道有不喜欢图书馆的哥们,什么书都是自己买,买回来看一次立即做枕头,好比windows底下一个一个正版软件往回买一样,那真是有钱啊! 我就老想等俺有钱了,啥也不着急搞,就先搞个图书馆,专门把小学的书放幼儿园书架,把初中书放小学书架,把高中书放初中书架,把大学书放高中书架,把研究生书放在大学本科书架,把研究生书架放上几本大师作品。策略上不光免费借书还送额外礼物,再和douban啊,amazon 啊该合作的全合作一下,和一流的版商作者联系搞些精品图书,专门培养牛人。不是说书非借不能读么,我就不信书那么难读,不信我的图书馆没人来借书 :)