Dec 25, 2006 - 我的圣诞节

Comments

今天是圣诞节,大部分商店都关门了。我照例出门到Starbucks, 一杯炭烧一块面包。打开电脑查邮件,开始一天的编程工作。中午回来的时候顺手抄了本TIME, 看看今年的年度人物,也就是所谓的 “YOU”(你)。

互联网使用者当选《时代》周刊年度人物(图)

我看到的TIME封面和这个新浪网上的不一样。在YOU的地方,实际上是一个反射的聚合树脂材料(有点像汽车窗隔光热的)。因此,你可以在这个镜子中看到自己的样子。(你看我省了一块镜子钱)(补充:关于文章的中文翻译和真实的封面,可以参见和菜头的文章)

文章中有句话很经典,

It’s about the many wresting power from the few and helping one another for nothing and how that will not only change the world, but also change the way the world changes.


国内的有些
歪脖二点灵的同学开始欢呼了,我觉得没有必要,一来TIME也说,现在也不知道这条路的前途如何(而且后面给的例子基本上都是美国相关的人物,除了我们的 三表哥的不许联想)二来说实话,这个年度人物是给向社区和他人贡献内容的YOU, 不是给贡献流氓软件和流氓平台的网站制作者,当然,也不是给这样的用户网民:

1楼:沙发。
2楼:板凳。
3楼:楼上的,不要老坐沙发好不好?
4楼:今天真靠前,顶一下。
5楼:支持博主,永远支持你。
6楼:我觉得博主就是个傻逼。
7楼:楼上的,说话文明点好不好?
8楼:激情电影下载、在线观看(省略数十条链接)
9楼:欢迎到我的博客观光,链接地址为……
10楼:寻找性伴侣,加我QQ,号码:×××××××××
11楼:支持国货的中国人请到这里投票,地址为……
12楼:博主我操你妈,博主我操你妈,博主我操你妈,博主我操你妈,博主我操你妈,博主我操你妈……
13楼:看你的博客很久了,越来越喜欢你。
14楼:博主终于更新了。
15楼:博主,我们交换个连接吧。
16楼:如何让自己更加坚挺,点击下面链接:《男人坚挺的十大秘诀》。
………” (摘自王三表的不许联想

(大家有习惯的照抢沙发啊,我只是就歪脖二点灵说事)

===========(我是无语的分割线)====

附带说一个问题,怕自己忘掉。最近月光Blog就Google出现的机器翻译中侮辱中国的问题发表了一篇文章。我看着觉得有点纳闷。当然我不是NLP(Nature Language Processing)的专家,甚至连入门都没有。不过我觉得他说的至少有两个问题:

我分析这个错误可能是这么产生的,就是在Google的自动机器学习过程中,主要学习的是一些西方文献以及其翻译结果,由于西方对于中国的评价大多都是 负面的,因此某些”不好的字眼”经常和”中国”一道出现,当出现的频率很高的时候,Google就根据以往的常识,将这个”不好的字眼”和”中国”进行了 一定关联,于是就出现了这种智能推测,导致了所谓的”Google辱华翻译事件“。

  1. (假设按照月光所说,Google的词对齐全部按照双语网页作为收集 )shame 和中国联系的假设肯定不正确。

如果说美国人第一眼看到shame, 联系起来的绝对是Bush, 而不是China. [和shame 搭配的词太多了,China的概率肯定不是最大的,shame+bush返回的网页就比shame+china多的多,而且问题是不光shame联系起china, 还有很多词,说实话我平时听那些词的时候好像从来没有和China搭配]

总的来说,Google放弃传统的翻译方式,改而使用机器自动分析统计识别的方法,是一大进步,极大提高了文章的翻译质量,后续Google应该做的是优化识别统计算法,使得翻译的结果更加准确。

  1. 我不知道月光是否理解机器翻译和统计语言模型,说话MS前后矛盾。如果结果不正确是语料库的问题,那么应该优化/扩大语料库,和算法没什么关系才是。

当然我是同意月光所说的”技术问题”而非”政治问题”的,只是有点小疑问写下来。想起大半年前在Google面试时曾向李开复博士请教他的语音识别(很汗的是这个居然是我问他的面试问题附加问题,据说标准的问题应该是 “您认为Google在中国怎样本土化或者怎样迎接baidu挑战” 以便让人觉得面试者对Google有很好了解滴~~ sigh, 当年多么勤奋好学~~),他也曾和我说过是用类似HMM的模型。这个很好理解了,Google有最庞大的网页,因此相邻状态转移概率很好算,参见黑板报的 统计语言模型,但是实际上不可能在所有的英文单词和中文词组中做全局的搜索,这里还有一个词典(当然也是统计意义上的)。月光假设说这个词典存在,shame就是翻译成和中国有关,我不大相信,我看熊猫也没翻译成中国熊猫,李宇春也没翻译成中国超女李宇春,他们与中国的相关度都比 shame-中国 高的多。还有就是”优化识别统计算法” 说的实在比较模糊。如此辟谣有点糊弄大众。

关于机器翻译,统计模型也未必最好,目前变结构的翻译(英文从句在后,中文就在前了)还有保证没语法错误的翻译也还不是太完美。

一些参考文献:

关于Google机器翻译的介绍在这里

关于统计语言模型在 这里(此文正好发布在我在Google面试结束回南京第二天,记忆尤其深刻)

关于HMM对语言翻译的处理在这里


附:本Blog于2007年新年将有一篇重量级客座文章发表。自即日起为钓起大家胃口,暂停发布几天

Dec 24, 2006 - GuestBlog-3. 海纳百川, 有容乃大: ITU 2006青年领袖论坛杂记 — By George Ran REN

Comments

作者简介:George Ran Ren, 曾任南京邮电大学科协主席。前不久刚作为”年轻领袖”代表(中国地区仅两位)参加香港举行的ITU(国际电信联盟)大会。 我与George 通过一次演讲认识,George 宽阔的科研视野和深厚的编程功底给我留下深刻印象。 他曾是南京市年龄最小的SCJP, SCJD, MCSE, MSDBA, 若干竞赛的优胜者,也是Stanford ATI, MS TechEd 等高水平会议的与会者。 难能可贵的是他还抽出宝贵时间参加MIT OpenCourseWare 的中文化工作。他同时也是ACM Crossroads 南京联络人。在闲暇时间,他喜欢听王力宏的歌和书法,你可以访问他的 个人主页,或者通过 ranren[A@T]ieee.org 联系他。

我想简单的把这次的会议做一个总结,再谈一谈自己的想法。

青年论坛始于2001年非洲电信展,自此之后,青年论坛便成为了国际电信联盟电信展不可缺少的环节。历时五年,共有超过500名来自世界各地的学生参与青年论坛。而此次,共有来自150个国家的256名”青年领袖”参与本次论坛。他们来自不同的国家和地区,有着不尽相同的学科背景,这种地域、国家、民族、宗教以及学科的多样性使得本次青年论坛生机勃勃、丰富多彩。来自五大洲各国的”青年领袖”们欢聚一堂、共谋发展,实乃信息通信界的一大盛事。此次的青年论坛主要分为如下几个议题:第一是互动研讨会;第二是青年宣言的起草;第三是商业计划大赛。

在互动研讨会期间,大家都很兴奋,因为我们有机会和全球业内最顶尖的专家互动,了解他们对行业现存问题和未来发展的看法。在互动环节中,大家发言积极踊跃,经常出现几个人争一个话筒的场面。由于我准备较为充分,所以每一次我都能够提出自己的想法和质量较高的问题。我也成为为数不多的能在三个互动研讨会上都能发言并提问的代表之一。这种互动研讨会极大的激发了大家的参与意识,提出了一些很有价值的问题,诸如企业的社会责任感、本地技术标准的国际化、在商业投资中如何规避风险以及如何缩小数字鸿沟等等。

通过三天的研讨、交流和辩论,会议进入第二项议程:《青年宣言》的起草。《青年宣言》包含宣言和行动计划两部分。宣言的起草过程大致分为三个步骤。第一步,每个小组需要用简短的语言叙述两个行动计划;第二步是由每个组的组长对这些行动计划进行打分评比,得分最高的八个意见将会被收录进《青年宣言》中;第三步所要做的工作是汇总。把所有的行动计划综合起来,形成几点主要意见,写入《宣言》的”行动计划”部分。此外,我们还需在宣言中加入”远景”和”存在问题”部分,使之成为一份完整且正式的《国际电信联盟2006年世界电信展青年论坛青年宣言》。做为G组的组长,我参与了投票,我组的行动计划做最高得票的计划之一,被收录进定稿的《青年宣言》行动计划部分第一条。下午,我们前往香港迪斯尼度假区游玩,但是,做为《青年宣言》的十位主要起草人之一,我们不得不错过迪斯尼美丽的焰火表演而匆匆赶回酒店开始宣言起草的第三部分工作。不过,我们知道,做为未来信息通信界的领袖,这是我们的责任。我们十人,就在酒店我的房间里开始了紧张而又有趣的起草工作。起草过程中,争论是难免的,因为我们所有人都明白,第二天早晨,这份宣言将会在全世界公布,它将代表着全部参会的256名代表的心声,也代表着全世界青年的心声。

在起草”远景”这一部分时,我重点向各国的”青年领袖”介绍了胡锦涛主席在联合国成立60周年首脑会议上提出的”努力建立持久和平,共同繁荣的和谐世界”的理念,并阐述了我理解的”融合世界”(converging world)的观点――在信息通信界技术,监管和资本运作方面都面临全球范围的整合、交流与合作。得到大家的一致认可,并最终写入《宣言》。经过整整一夜的艰苦奋战,我们在凌晨6:40分完成了《青年宣言》的大部分起草工作,这时离这份宣言的公布仅有3小时左右的时间。

此次青年论坛另一个激动人心的是新加入的”商业计划比赛”活动。”商业计划比赛”是本次青年论坛的最后一项重要议题。”青年领袖”们自愿组队或单独提交自己的商业计划,由比赛组委会进行评比并最终评出奖项。比赛设一、二、三等奖各四名。获得一等奖的商业计划不但可以获得奖金,更有机会获得风险投资商的进一步资助。最终,大赛组委会在提交的120份商业计划中最终评出了12份获奖计划。令人兴奋的是,我的计划获得了一等奖第一名。

在香港的8天是疲惫的8天,更是令人永生难忘的8天。说疲惫,是因为会议紧凑的时间安排根本无法允许我们有多余的睡眠时间。别说午休,就连晚上的睡眠也只能称得上打盹。由于参加了商业计划比赛和青年宣言的起草两项重要活动,所以我平均每天只能睡上4个小时,每天都是一上大巴就睡着了,大巴到站就要下车参加不间断的活动。但是,更重要的是,这是值得的。就像一些”青年领袖”最终离开香港前说的那样,这是”改变一生”的8天。我认为丝毫不夸张,在这8天中,来自世界上不同国家、不同地区、不同宗教信仰、不同肤色、不同语言和不同专业背景的256名”青年领袖”在一起交流、辩论甚至是争论,从中我们不断丰富自己的知识,拓宽自己的眼界、增长自己的才干,同时也结识新的朋友。在这8天中,我们一起住宿、用餐、参加论坛、到迪斯尼游玩以及去香港市中心购物……太多美好而经典的回忆。来自美国的代表和来自伊拉克和伊朗的代表亲密的交谈,拍照;来自阿拉伯世界的代表和以色列的代表一起出去唱KTV…… “青年领袖”们消除了时空的距离、政治的障碍和种族的隔阂,真正诠释了什么才叫作真正的”全球一家,共谋发展”。到这里,我们才真正领会到青年论坛的真正含义,这不仅是全球信息通信界青年精英的聚首,更意味着全人类追求的共同心愿――平等、和平、繁荣与和谐。

最后祝大家圣诞快乐!

PS: 本次活动的照片可以通过如下链接访问 http://www.flickr.com/photos/rsqr/sets/72157594414923344/

Dec 24, 2006 - GuestBlog-3(圣诞节特稿). 海纳百川,有容乃大–ITU 2006青年领袖论坛杂记 By George Ran REN

Comments

作者简介:George Ran Ren, 曾任南京邮电大学科协主席。前不久刚作为”年轻领袖”代表(中国地区仅两位)参加香港举行的ITU(国际电信联盟)大会。 我与George 通过一次演讲认识,George 宽阔的科研视野和深厚的编程功底给我留下深刻印象。 他曾是南京市年龄最小的SCJP, SCJD, MCSE, MSDBA, 若干竞赛的优胜者,也是Stanford ATI, MS TechEd 等高水平会议的与会者。 难能可贵的是他还抽出宝贵时间参加MIT OpenCourseWare 的中文化工作。他同时也是ACM Crossroads 南京联络人。在闲暇时间,他喜欢听王力宏的歌和书法,你可以访问他的 个人主页,或者通过 ranren[A@T]ieee.org 联系他。

我想简单的把这次的会议做一个总结,再谈一谈自己的想法。

青年论坛始于2001年非洲电信展,自此之后,青年论坛便成为了国际电信联盟电信展不可缺少的环节。历时五年,共有超过500名来自世界各地的学生参与青年论坛。而此次,共有来自150个国家的256名”青年领袖”参与本次论坛。他们来自不同的国家和地区,有着不尽相同的学科背景,这种地域、国家、民族、宗教以及学科的多样性使得本次青年论坛生机勃勃、丰富多彩。来自五大洲各国的”青年领袖”们欢聚一堂、共谋发展,实乃信息通信界的一大盛事。</p>

此次的青年论坛主要分为如下几个议题:第一是互动研讨会;第二是青年宣言的起草;第三是商业计划大赛。

在互动研讨会期间,大家都很兴奋,因为我们有机会和全球业内最顶尖的专家互动,了解他们对行业现存问题和未来发展的看法。在互动环节中,大家发言积极踊跃,经常出现几个人争一个话筒的场面。由于我准备较为充分,所以每一次我都能够提出自己的想法和质量较高的问题。我也成为为数不多的能在三个互动研讨会上都能发言并提问的代表之一。
这种互动研讨会极大的激发了大家的参与意识,提出了一些很有价值的问题,诸如企业的社会责任感、本地技术标准的国际化、在商业投资中如何规避风险以及如何缩小数字鸿沟等等。

通过三天的研讨、交流和辩论,会议进入第二项议程:《青年宣言》的起草。《青年宣言》包含宣言和行动计划两部分。宣言的起草过程大致分为三个步骤。第一步,每个小组需要用简短的语言叙述两个行动计划;第二步是由每个组的组长对这些行动计划进行打分评比,得分最高的八个意见将会被收录进《青年宣言》中;第三步所要做的工作是汇总。把所有的行动计划综合起来,形成几点主要意见,写入《宣言》的”行动计划”部分。此外,我们还需在宣言中加入”远景”和”存在问题”部分,使之成为一份完整且正式的《国际电信联盟2006年世界电信展青年论坛青年宣言》。做为G组的组长,我参与了投票,我组的行动计划做最高得票的计划之一,被收录进定稿的《青年宣言》行动计划部分第一条。下午,我们前往香港迪斯尼度假区游玩,但是,做为《青年宣言》的十位主要起草人之一,我们不得不错过迪斯尼美丽的焰火表演而匆匆赶回酒店开始宣言起草的第三部分工作。不过,我们知道,做为未来信息通信界的领袖,这是我们的责任。我们十人,就在酒店我的房间里开始了紧张而又有趣的起草工作。起草过程中,争论是难免的,因为我们所有人都明白,第二天早晨,这份宣言将会在全世界公布,它将代表着全部参会的256名代表的心声,也代表着全世界青年的心声。
在起草”远景”这一部分时,我重点向各国的”青年领袖”介绍了胡锦涛主席在联合国成立60周年首脑会议上提出的”努力建立持久和平,共同繁荣的和谐世界”的理念,并阐述了我理解的”融合世界”(converging world)的观点――在信息通信界技术,监管和资本运作方面都面临全球范围的整合、交流与合作。得到大家的一致认可,并最终写入《宣言》。经过整整一夜的艰苦奋战,我们在凌晨6:40分完成了《青年宣言》的大部分起草工作,这时离这份宣言的公布仅有3小时左右的时间。

此次青年论坛另一个激动人心的是新加入的”商业计划比赛”活动。”商业计划比赛”是本次青年论坛的最后一项重要议题。”青年领袖”们自愿组队或单独提交自己的商业计划,由比赛组委会进行评比并最终评出奖项。比赛设一、二、三等奖各四名。获得一等奖的商业计划不但可以获得奖金,更有机会获得风险投资商的进一步资助。最终,大赛组委会在提交的120份商业计划中最终评出了12份获奖计划。令人兴奋的是,我的计划获得了一等奖第一名。

在香港的8天是疲惫的8天,更是令人永生难忘的8天。说疲惫,是因为会议紧凑的时间安排根本无法允许我们有多余的睡眠时间。别说午休,就连晚上的睡眠也只能称得上打盹。由于参加了商业计划比赛和青年宣言的起草两项重要活动,所以我平均每天只能睡上4个小时,每天都是一上大巴就睡着了,大巴到站就要下车参加不间断的活动。但是,更重要的是,这是值得的。就像一些”青年领袖”最终离开香港前说的那样,这是”改变一生”的8天。我认为丝毫不夸张,在这8天中,来自世界上不同国家、不同地区、不同宗教信仰、不同肤色、不同语言和不同专业背景的256名”青年领袖”在一起交流、辩论甚至是争论,从中我们不断丰富自己的知识,拓宽自己的眼界、增长自己的才干,同时也结识新的朋友。在这8天中,我们一起住宿、用餐、参加论坛、到迪斯尼游玩以及去香港市中心购物……太多美好而经典的回忆。来自美国的代表和来自伊拉克和伊朗的代表亲密的交谈,拍照;来自阿拉伯世界的代表和以色列的代表一起出去唱KTV…… “青年领袖”们消除了时空的距离、政治的障碍和种族的隔阂,真正诠释了什么才叫作真正的”全球一家,共谋发展”。到这里,我们才真正领会到青年论坛的真正含义,这不仅是全球信息通信界青年精英的聚首,更意味着全人类追求的共同心愿――平等、和平、繁荣与和谐。

最后祝大家圣诞快乐!

PS: 本次活动的照片可以通过如下链接访问 http://www.flickr.com/photos/rsqr/sets/72157594414923344/ </div>

Dec 23, 2006 - 怎么一放假反而更忙了

Comments

老板说,下周我们再meet 一下吧,啊…. 一个程序两个报告…. 于是我开始日夜奋战中.

我就奇怪呀,我不是平时没这么忙的么,还能烧个菜看个电视什么的,怎么一放假倒天天急急忙忙的,奔走于学校和家…

忙啊忙啊,我在想平安夜的时候我是不是要坐在圣诞树边上写程序…. 或者我是不是要把我们家烟囱塞起来免得圣诞老人进来打扰我。当然最好的方法莫过于放一张空光盘在红袜子里,一觉醒来光盘上就是我要的程序。可是后来又想,这个圣诞老人有CD-RW驱动器么… 后现代狂想中…

希望圣诞节那天不要去工作,要不然我就真的要疯了。那天有哥们长叹一口气幽幽的说 “唉,平安夜果然是俺贫夜,圣诞节果然是单身节”。 哈哈,我有程序电脑做伴 :)

==========下文少儿不宜=================

自从开展追女生能否改变世界的大讨论以来,总共有若干同学发表意见

同意不能改变世界者:solrex, mathena.

辩证主义者: George, (dramatically), Sabrina(inner world)
两面三刀者:Forrest (一方面发贴一方面老和我提某女生,下次再提ban了你!)
不发表意见者:若干男女生
极力反对者:某女权主义者</p>

总结:卖糖水不能改变世界的话好像大家都不反驳,但是追女生能否改变的倒各有说法。到底是改变还是不能改变?

(中国)移动用户发送短信到55520,联通用户发送到66520,固定电话和小灵通用户拨打16888520 参与我们的”互动赢大奖”活动,
(美国)Verizon用户,Sprint用户和T-Mobile用户可直接拨打电话800-888-8888, (注:我们不会询问任何关于您个人隐私的问题)
(其他国家或地区,包括火星) 到 bbs.nju.edu.cn 发贴
(以下是火星语说明:¥#%⋯⋯—*()(*—⋯⋯%¥#@#¥%⋯⋯——*(*—⋯⋯%¥#@#¥%⋯⋯—*)

最有理由之消息将上交ETS作为GRE issue部分评分。(信息费每条1美元)</span></span>

Dec 20, 2006 - 高兴啊高兴啊

Comments

对于我这样的书呆子来说,还有什么比找到missing book 更高兴的呢,而且在刚考完所有考试寒假正式开始的时候。

Knuth的MMIXware 被我戏称为十大 Missing Book 第二名(第一名是TAOCP Vol4)原以为继续由Addison-Wesley 出版的,所以Springer的LNCS系列一直没注意。今天找论文,发现一本书封面赫然写着Knuth, 居然就是这个,天哪,我一直认为LNCS只出会议论文集,从不出单独著作的….估计在我眼皮底下已经略过好几回了,还是被我逮着了..

MMIXware: A RISC Computer for the Third Millennium

(图片来自Amazon.com, 不过我借到的封面居然是红的,这可能也是我无数次忽略的原因)

高兴啊高兴啊,寒假第一天就这么爽,好,寒假好好看书,认真学习!

今天高兴的还有一件事情,Blogger (就是我的主博的BSP)告别beta 了。在Blogspot的官方网站上写到:

The new version of Blogger in beta is dead!
Long live the new version of Blogger!
(P.S. The old version of Blogger is not dead, but it would like to retire for a little while… maybe go to Hawaii or play World of Warcraft all day? It begs you to let it play World of Warcraft all day.)

翻译成中文就是:
老的Blogger Beta版终结啦
新的Blogger万岁(Blogger一语双关,也指写Blog的人)
(附注:其实老版本的Blogger没有终结,而是暂时退休一下下,恩,可能是去夏威夷度假了吧,要不就是整天玩魔兽世界? 它请求你让他整天玩魔兽世界的)

这个才是我熟悉的Go ogle的风格,这样的 Goo gle 谁不喜欢 :) (如果这个彩色的Google中间还是多出空格,那么Gmail的这个Bug还是没修好,我都report了差不多要一周年了)