Jun 18, 2007 - “我不会”与“我要去学” [zz]

Comments

作 者: baosheng

标 题: “我不会”与“我要去学”

时 间: Fri Jun 15 11:52:31 2007

原文地址

遇到一个新的东西(比如一个新的算法,或者一个新的软件),一种人说“我不会”,然后就跑开了,另外一种人说“我要去学”

于是大学四年这样的过程周而复始,repeat了多少次之后,这两种人的差距就拉大了。后一种人往往实现了自己满意的人生目标(想加入的公司,想就读的大学, etc.) ,而前一种人则开始抱怨诸如“出国形势不好是因为xx系烂”或者“自己被学校耍了”。

比如很多人号称要学linux,当你真的把一个运行linux的计算机放到她面前的时候,她说什么不会用。而另外一种人听说”Linux has many exciting features”,于是自己就去学。四年后,这两种人已经没有共同的语言了。

不过中国的大学里面说“我不会”的人是远多于说“我要去学”的人,所以大部分的大学生是除了老师上课讲的那些东西,就其他什么都不知道了。所以我们的大学只是分为白天的宿舍和晚上的宿舍罢了。

无数的人坐在教室里面听临毕业的学长介绍经验,但是他们的心还是停留在“我不会”的阶段,空想如何成为学长那样的牛人,却又没有“我要去学”的实际行动。

于是不会TeX的人,终究还是不会TeX,虽然他和数模的队友一起知道TeX这个东东;不会Linux的人终究还是不会Linux,虽然他和舍友一起听学长介绍Linux;没做过project的人终究还是两手空空,虽然他和同学一起去找老师号称要进实验室;没发过paper的人还是不知道简历上写什么,虽然他总想着要看多少书;没玩过ARM的同学终究还是没有看到Qtopia如何在开发板上跑起来,虽然他和师兄一起去买ARM开发板。

四年,人的差距就是这样拉开。后面的岁月,差距会继续拉大。Palo Alto的天才在改变着世界,而你也许只有在别人提到新的奇迹的时候说,“我和xx是同学”,但是你却记不得和他的往事,也许当你在追mm的时候,他正在图书馆看书。

Jun 15, 2007 - Google 如此找人, 让我害怕

Comments

两个月前收 到Google 一个猎头的邀请我去谈谈的信后, 今天又收到另一个 Google 猎头的 Hello from Google. 其实只是被猎头找找聊聊, 这种事情也没啥值得拿出来炫耀, 只是我真的很奇怪, 不知道他们这些人是怎么用人肉搜索引擎发现我的邮箱的. 除了我的Blog 和几个个人主页, 我在网上从没留过邮箱. 我的Blog 和个人主页 PageRank 都是0, 怎么会被人发现呢?

面对 Google 猎头这些”套词”信件, 我真的对眼前这个巨头感到害怕起来.

  1. 可以想象, 每年无数优秀的人会被这样套词. 也有很多的人就此选择和Google面试.

  2. Google 是世界上最受欢迎的雇主, 拿了 offer 去的比例算是非常非常高的.

  3. 听我在Google 的朋友说, Google 每个人的员工号都是唯一的, 就算实习生以后走了, 员工号也就空在那里. 据说李开复的员工号已经是10000+了. 我曾经打算要是博士毕业加盟Google, 指不定能搞到 32768 (2^15), 但据朋友说此号码已经分配了. 估计等到我毕业的时候, 65536 (2^16) 也没有了.

  4. 据说如果 Google 猎头招到优秀的人, 是有奖励的. 这也是猎头不停发邮件的原因. 可问题是再这样无序的满地招人, 到处发信(我个人的感觉), 这个公司就不是求贤若渴, 而是圈人运动了. 如果一个公司的架构不能适应这样的招人速度, 越多的牛人进来, 问题只会越尖锐.

  5. 如果Google 架构很好, 可以养这么多牛人, 他们要是不造 Google 牌航天飞机, 把总部搬到火星, 或者造宇宙终极计算机, 还真对不起他们的智商和Google 赚的钱.

总之, 一方面, 我觉得要是真的这样到处发信招人, 即使是求贤若渴, 也绝对不是健康发展的 Google; 另一方面, 如果Google 真的这样健康发展, 几年后Google 是不是真的该造出什么终极的让其他互联网公司根本无力抗衡的东西出

来? 无论怎样, 说实话, 这样的Google, 让我害怕.

现在, 我只想做个普通的学生. 希望等我毕业的时候, Google 还是如日中天, 并且我能顺利加入这家伟大的有趣的公司. 至于我的员工号, 我希望是111111(十进制).

猎头: 我现在对我从事的项目非常感兴趣,我感觉到我正在做一些了不起的研究和应用; 而且,我必须先完成我博士学业。所以,我暂时不会加盟其他公司。如果将来加盟其他公司,我的第一选择是 Google.

Note to recruiters: Please don’t offer me a job now. I am quite proud of my current research and project. Additionally, I have to finish my Ph.D. study first.

Google will be my first choice in the future.

另: 哪位朋友想加盟Google, 我或许可以代为推荐, 我在Google 也有能帮助推荐的朋友. 可以坦率的说, 推荐的分量比自己投简历要重要得多.


有人说, 等我有了钱, 养一只狗取名叫古狗,养一只鸽子叫谷鸽. 本文和这句话一样, 纯属ZB, 请用自己智力判别.

Jun 12, 2007 - 芝加哥一日行

Comments

昨天在芝加哥参加  ACNW Optimization. ACNW 是 Argonne National Laboratory, University of Chicago, Northwestern University, University of Wisconsin 的缩写. 就是由能源部阿岗国家实验室, 芝加哥大学, 西北大学和威斯康星大学(麦迪逊) 一起合搞的一个小型研讨会. 老板很照顾我, 带我去见见市面. 此行收获很大, 一一记下.

怎么去的暂且不表, 一个经验就是到机场大约25分钟, 安检最近大约要40分钟. 芝加哥市区到机场大约20分钟, 坐小火车需要50分钟. 下次如果坐飞机, 时间规划可以巧妙一点.

今年主要议题是Optimization and Machine Learning, Mixed Integer Nonlinear Programming. 先是 UTexas 的 Inderjit Dhillon 讲 Matrix Nearness Problem, 超级多的公式看不懂. 唯一感兴趣的就是他用一个比较好的框架处理了 Machine Learning 中的一堆问题, 很有启发. 然后是 IBM T.J. Watson 研究所的 Jon Lee. 这哥们是 IBM 离散优化问题的主管, 做的报告幻灯片搞笑无比. 讲的 MINLP 问题深入浅出, 后悔当时没带DV, 否则应该把过程记录下来, 好好学习技巧.

中午吃饭, 老板说要培养 network, 要善于结识别人. 所以后来也胆大了, 和 ANL, Wisconsin, 还有 UIUC 的几个学生和教授都说了几句话. 然后认识了一堆牛人. 这些牛人很有个性, 很有意思.

Jorge More 是ANL 的牛人, 开发 TAO 和 NEOS (开放的优化问题解题服务器)的人. 看上去超级随意, 而且还和西北大学开玩笑, 说因为 cookie 是西北赞助的原因, 就不说西北大学坏话了. Svan Leyffer 也是ANL的牛人, 是老板的好朋友, 他的一个 FilMINT solver 老板说是世界上最好的解 MINLP 的了. 这哥们也超级爱开玩笑. Jorge Nocedal 是西北 EECS 和管理的双面教授, 是师弟李刚同学的未来老板. 反应极快, 问问题一针见血, 好几个做演示的人都被他一问就知道自己想法有问题了. 不过这个牛人挺丢三落四的, 组织的会议要收注册费, 不过他忘带收据了, 秘书也找不着了, 只要打白条 :).  Michael Ferris 是威斯康星 CS 和 工业系统工程双面教授, 也是超级聪明, 人和主页上图片一样, 似乎N多年都是一样年轻. Robert Fourer 是西北的教授, 当年在贝尔实验室搞出了 AMPL (另两个开发者是 David M. Gay 和 Brian W. Kernighan), 一下子成了我们的行业标准. 他是个标准的 geek, 说话比较模糊嘟囔, 用一个超级小的装着Linux的计算机, 背一个大破包, 超级酷.

Optimization 问题是一项跨学科的事情, 昨天遇到很多超级多的工业工程的, 管理的, 计算机的, 系统工程的, 统计的, 当然还有数学的, 感觉这个行业很有应用, 我要好好学习, 认真解决点有用的问题.

Jun 10, 2007 - 应当有点精英意识

Comments

和朋友打电话, 不知道怎么说到了精英意识. 而我, 这几天, 又目击了某个身边朋友的一次”黑鹰坠落”.

其实我有些浅陋的人生体会一直想对有些师弟师妹和朋友说: “我们应当有一点精英意识“. 大学再怎么扩招, 我们周围的同学都至少是百里挑一的, 我们必须在头脑中种下这个理念, 并且反过来要求自己百里挑一. 精英意识不是站在高位去鄙 视他人, 是要高标准要求自己. 我倒不是说追求圣人般清心寡欲或超人般凡事得第一的那种高标准, 而是说尽量不要浪费时间在无聊的事情上, 不要在这个浮躁, 虚拟的世界里放纵自己的欲望. 我在南大四年, 一届一届的无数经验告诉我, 凡是游戏打得昏天黑地的, 最后人生都昏天黑地; 我们这 个时代, 可以浪费时间的玩物, 可以使人堕落的诱惑, 都实在太多了. 玩物可以怡情, 丧志就让关心你的人痛心了.

学习和生活基本都是相通的, 基本上如果没有一种责任, 道德和积极的生活态度, 学习基本上也弄不好. 生活上该怎样, 我自己也组织不好语言, 总之, 我觉得积极健康而负责任的生活方式是好的, 值得追求的.

中 国有句话叫 “尔曹身与名俱灭,不废江河万古流”. 昆德拉也有一句意思相近的话叫做”人类一思考,上帝就发笑”. 是的, 个人相比于这个广袤的宇宙太渺小了,无论怎样的成功或者失败, 无论个人怎样的出色或者沉沦, 其实都是渺小的. 即使如此, 作为一个个体的人, 还是要立志立常志,做人做大人; 金钱、权力和高人一等的优越感只能塑造一 点可怜的傲慢, 只有良好的社会责任感, 高水平的人生追求和敢于冒险敢于挑战的精神, 以及通过自身努力赢得的骄人的成就, 才能赢得别人的尊敬和尊重. (放心, 我们都是普通人, 我决不是在传教, 而是作为一个理想主义者一样, 在探索我的人生价值. 其实我在说这些话的时候也在脸红.)

我 们都是受中国文化影响深重的人. 从小就知道别人夸奖的时候, 说一声: 我不行. 要隐到人群中去做一个中庸的普通人. 不过受了西方文化的影响后, 我倒觉得, 就是要有点精英的意识, 如果哪天别人夸奖你的时候, 能够体面地有底气有自信地说一声”谢谢”, 那该是人生多么自豪和美好的时刻啊!

此文送给我那个暂时不得志但是以后一定很优秀的朋友, 以及我自己. 我以后的人生旅途, 未必能如现在一样把这个问题想得这么透彻而积极.

Jun 9, 2007 - 拼写检查器的一点注记

Comments

拼写检查这个东西, 其实就是求文本集合与词典集合的差集. 因此, 使用一点简单的命令行技巧, 就可以发现拼写错误.

可是实际情况不这么简单, 因为面对的可能不仅仅是纯文本, 比如我在 Linux 下, 最需要拼写检查的是我的网页和我的论文, 也就是 HTML 文件 和 TeX 文件. 不过, Linux 下这些工具早就有了. Aspell 就是这样一个强大的工具.

Word 和其他的工具都可以执行拼写检查, 不过Gmail 的简单拼写检查实在是方便无比, 强烈推荐大家在需要拼写检查的时候使用.

说到Google, 让我们看看 AI 大牛, Google 研究主任 Peter Norvig 怎样用 20 行 Python 代码写一个基于概率模型的拼写检查器. 我利用闲暇时间把这篇文章翻译成了中文 [这里].

如果在内存受限系统上开发, 比如嵌入式系统上, Peter Norvig 的方法就不太可行了. 因为连词典存下去都够呛. 这时候, 比较好的方法肯定是用 hash 表. 不过单一 hash 表错误率比较高, 我们可以使用 Bloom Filter [wiki], 这里提供了一个简单的实现. 这个实现非常有启发性, 因为他考虑了词的变形, 比如 -es -ing 后缀. Peter Norvig 虽然在文中提到这个问题, 却没有解决这个问题, 有兴趣的读者可以尝试自己重写一下 Peter Norvig 的代码. 我把 Bloom Filter 实现拼写检查的代码重新写了注释在此.

补几句废话:

  1. Python 语言简洁迷人, 这20行代码说明了一切 :)

  2. 时间都是挤出来的, Peter Norvig 这篇文章是我陆陆续续每天睡觉前敲几行字翻译出来的. 翻译完了觉得, 人贵有恒.

  3. 写这篇完全出于好玩, 我既不是搞自然语言的专家, 也不是Python 高手. 研究方向也和这些不搭边. 因此如果有见识浅陋的地方, 或者遗漏了一些, 大家多交流.