Jun 10, 2008 - 全是魔戒惹的祸

Comments

周末我常常看出去电影.

第一周, 我赶上了 的首映. 看完第一部回来以后, 我眉飞色舞的和女友说, 你看, 就是**魔戒**+中国功夫嘛. 好莱坞就是这个套路. 女友挺同意的.

几周后, 我又出去了, 这回是看 <The Chronicles of Narnia: Prince Caspian> 的首映. 看完之后我又说, 你看, 这个完全没有角色塑造和冲突吧, 最后就是靠那个装逼的狮子解决问题. 战争场面特技简直就是和魔戒一样嘛. 女友同意我说的装逼狮子 Aslan, 但是对于我的”和魔戒一样” 未置可否.

貌似上上周, 我又出去了, 这次是看 的首映. 看完之后我就说, 这简直是大烂片. 你看, 寻宝都和外星人扯上关系了. 这个送水晶头骨分明就是**魔戒**翻版嘛, 你说怎么好莱坞就成天炒冷饭呢. 女友终于忍不住了, 说: Eric, 你对这些电影的批评很激烈. 可是你为什么总说他们是魔戒4 魔戒5 魔戒6 呢, 难道他们没有自己的特色么. 批评电影怎么老套用魔戒标准呢. 难道魔戒是有史以来好莱坞拍过的所有的电影么.

这番话让我反思, 一旦一个人, 接触到一个好的东西以后, 就会忍不住用这个东西的视角去看其他的. 我常常听到说: 拿着榔头, 样样是钉子. 事实上也是如此, 我自己感觉, 学到了一样理论, 一个学说, 就迫不及待的想要用他来看待世界, 改变世界. 或许这个事情本身不是坏事, 坏的是因为沉迷在这样好的东西中, 反而把自己变得狭隘起来. 就像带上了魔戒, 获得了比以前大得多的魔力, 所以沉迷其中, 自觉不自觉的被魔戒控制了. 而真正的更高一个层次的力量, 却因为自己的狭隘而自我妨碍了.

拔高一点来说, 一种美妙的学说, 一个号称普世的主张, 或者一个构造精巧的理论, 一个看似完美的标准, 都可能是个魔戒, 让人暂时获得认识和控制眼前世界的快感, 却从长远来说限制了一个人的视野, 控制了一个人的思维方式, 这样的魔戒, 最好还是不要戴, 或者至少不要得到了就欣欣然.

我忘不了当年被老师告知一切社会活动都是阶级矛盾推动之后带着阶级的眼镜到处划分人群的那种变态快感; 我忘不了听说自由民主能解决一切不公正社会问题后那种对西方完美世界的绝望似的渴望. 同样也忘不了当年自学了平面几何以后觉得世界就在尺规中的那种狂傲, 以及王小波写的傻大姐一声一声的我会缝扣子. 理论本身不是什么魔戒, 老是带着, 不摘下来, 才是魔障. 用佛法里面的话说, 就是贪恋中间境界, 也就不能精进勇猛, 修无上道了.

Jun 4, 2008 - 一二三四五六七十百千万

Comments

十九八七五三二一

在缺失的数字面前, 任何文字都是多余的.

Update:  本博客史上最强的留言,  算是给这个空前绝后的数字做一个注脚.

dd said, {.commenttitle}

June 4, 2008 @ 8:26 pm

9875321这个数字具有很神奇的性质。

首先,它是一个质数。第二,它的各位数字是依次递减的。第三,把它的数字逆转过来,变成各位数字递增的1235789,仍然得到一个质数。第四,它是满足以上三条性质的数字中最大的一个。

Jun 3, 2008 - 眼前有景道不得, 崔颢题诗在上头

Comments

一年前我在写别拿技术忽悠人之后, 就想专门写一篇文章, 讲讲中文输入法的实现方法. 后来有人批评小企鹅的代码风格不好, 我还专门看了小企鹅的源代码, 写了不该指责别人代码风格的10个原因. 再后来因为自己的G4老苹果上使用 FIT 输入法速度比较慢, 为了给个别地方做优化, 又细看了 FIT 的源代码, 基本上把 FIT 的架构也弄得很清楚了. 所以, 一直想专门写一篇文章, 讲讲输入法里面的前缀树, 统计语言模型等好玩的有趣的东西. 可是一直拖着, 也比较懒, 就从来没下决心动笔.

我喜欢研究中文输入法的原因也很好理解. 这个东西麻雀虽小, 五脏俱全. 从发展的过程来看, 以前的中文输入法就是字母到汉字的映射, 一点都不能错. 比如五笔型. 后来慢慢的以词为单位的输入, 很多用拼音的人速度开始超过用五笔型的. 再慢慢的, 微软出了微软拼音, 整句输入开始占上风. 打整个句子非常顺畅. 所有的这些, 其实都是底下数学模型的发展和词库数据的不断完备带来的, 虽然一般的用户并不觉察. 在用户的不知不觉中, 输入法慢慢迁移到基于统计语言模型了.  这些一代一代的输入法的变迁, 正好反映了从简单的规则算法到智能的基于机器学习的算法的变迁. 因此, 研究输入法就是研究一个经过很多代进化的实际有用的算法, 这个过程会非常有乐趣. 其次, 研究一个输入法, 要比研究一个语音识别简单多了.  而两者根本模型却大差不离. 因此研究输入法属于很讨巧的事情.  再次, 就我个人经验, 捣鼓一下输入法, 用几行编程技巧, 改几个简单的模型, 或者优化一点小小的数据结构, 都能让效果立刻体现, 这其中的满足感不是其他人能体验的.  因为以上的这些原因, 我特别喜欢研究捣鼓中文输入法.

且说昨天发现 SUN 的 SUNpinyin 输入法, 读了几行源码, 欣欣然, 刚想动笔写一篇 语言模型在输入法整句匹配中的应用, 结果发现人家早就写了,而且写的比我想写的要好至少一个数量级. 这是由一个参与 Sunoinyin 维护 SUN 的工程师所写, 专栏叫 “SUN pinyin 代码导读“. 文章深入浅出, 细节交代很清晰, 我读完以后只能长叹 “眼前有景道不得, 崔颢题诗在上头” . 想了解输入法的同学千万不可错过这个专栏.

另外苹果用户可试用一下这个输入法,理论上(仅仅理论上) 这个输入法要比 FIT 更加好用, 因为目前按照我读代码的理解, FIT的整句匹配效果应该不如 SUN的这个.

(最后, 感谢 Yuking, Huajun, YongsunPhillzh. 若没有他们对开源社区的贡献, 我是不可能读到任何关于中文输入法的代码的)

Jun 1, 2008 - 因爱而信

Comments

很多年前的一个初夏, 六一, 我给一个喜欢的女孩子写情书祝她好运, 我写道: 虽不信神, 也愿祈祷.  今天我又读到一篇文章, 叫做:  从来没有像今天这样地祈盼天堂的存在. 我非常理解作者. 我多希望那些孩子全部在天堂里好好的. 其实, 大地震之后的七天里, 我每次打开网易新闻, 心里都先默念: 奇迹, 更多奇迹. 我愿意相信一个神, 给予废墟中的人更多的奇迹.

我也常常想, 像我这样不相信有神的人, 为什么还要为他人默念奇迹, 为什么要为喜欢的女孩子祈祷. 以前, 在教会朋友的询问下, 我曾经说, 我只相信物质世界(materialism) 他们总是很惊讶, 为何中国十多亿没有信仰的人, 没有变成大奸大恶之徒. 我也一度想不明白, 是否没有信仰的国度一定让有信仰的人感到悲哀, 一定会走向悲剧. 我想现在我部分知道了这些问题的答案: 我们其实有信仰, 我们因爱称信. 因为爱, 而信, 而望.

看新闻, 看那些志愿者在一线; 看同学, 朋友, 几乎每一个我认识的人都用各种方式参与抗灾; 听李连杰在北大说了几十次爱; 看很多平时政见不同的人都在一线手挽手做事情; 看高校大学生比着献血, 排长队还拿不到号码. 看唐山和各地朴实的农民工自己掏钱到前线, 做不了其他的, 就帮忙发水, 挖排水沟. 看一个个精彩的人与人之间的爱的故事, 不问来路, 不问回报, 一心付出.

我有朋友信仰耶稣, 我问为什么, 他说: 因为喜欢基督徒的那种有爱的生活方式.  虽然我逻辑上不认同因信而爱, 但我很支持他, 理解他. 如果因为信, 走到爱, 我觉得这个基督徒, 按照圣经的定义, 是一定能上天堂的. 同样, 佛教徒由信到普度众生, 也一定能成佛的.

我的书架上放了一本圣经, 翻开就是约翰书, 我从里面断章取义摘几段.

从来没有人见过神. 我们若彼此相爱, 神就住在我们里面</wbr>, 爱他的心在我们里面得以完全了.

  人若说, 我爱神, 却恨他的弟兄, 就是说谎话的. 不爱他所看见的弟兄, 就不能爱没有看见的神”

你若问我信仰什么, 我信仰爱. 不是矫情, 就是信仰. 我爱父母, 以及所有的所看见的兄弟姐妹.

May 27, 2008 - 贴照片 II

Comments

实在太忙, 贴照片充数. 每周末都做一定的户外运动, 故而又黑了,耶!

(明星狗 Brian Griffin 是本照片的主角)

img_0271.JPG

(淘了很多平均不超过10美元的好书)

img_0268.JPG

(最近老编程, 尝试了一下 Dovark 布局的苹果键盘, 据说打字很快)

img_0248.JPG