Oct 15, 2006 - Flash版本的CV

Comments

在尝试了从txt版本 到Word版本 到Openoffice版 到Html版 到LaTeX版本后, 终于认识到: pdf才是王道.

可惜的是, 人家到你的网站上来看CV, 还要下载. 我知道有些windows用户还要打开巨满无比的Acrobat [还不是Reader, 还是专业版]. 一般情况下虽然pdf很好, 一不小心在IE中点了就开始噩梦, Acrobat插件会把你小硬盘搞的震天响, 最后windows无奈了, 问你要不要往微软送报告.

这一些的噩梦就要结束了, 因为我发现pdf可以转成轻量级的swf啦. 这个工具在window和linux下都有的下载. 叫做 swftools 可以简单的把pdf转化成swf. [Linux用户友情提醒: 注意所有的依赖关系, 要不然通不过编译]

先看效果? 下面就是了:

小提示: 在Flash 上点右键可以选择停止播放, 如果你觉得字太小也可以放大. 感谢秋凌提醒. :)

Tips: You can right click your mouse and make the flash movie stop or zoom in. (Thank Qiuling’s suggestion)

Additionally: I will fix the bugs soon. (So sorry for haven’t done a proof reading)

Oct 15, 2006 - 我要开始一项研究

Comments

Abstract:

最近在研究图算法和分区, 需要研究把二部图分块. 遗憾的是很难找到非随机的二部图. 在仔细阅读了Knuth的Stanford Graphbase 后, 一个大胆的想法浮出水面: 根据现实某一个模型建立一个二部图. 这个图的节点就是中国当代男女明星, 这个图的边就是: 他们之间有没有绯闻. 先不要批评我八卦, 待我一一说明如下:

Motivation:

因为研究需要, 我们需要建立一个实际(非随机)二部图, 拥有大约300-500个节点. 受Knuth建立非随机二部图启发, 我希望这个图能够来自实际, 易于建立, 并且大家乐于帮我建立. 因此我要想一个让大家愿意来贡献内容的主意. 八卦是人的天性, 追星是人的要求, 因此我希望大家能够乐于告诉我新的节点(你喜欢或不喜欢的明星), 或者新的边(某男某女又好上了). 而且中国娱乐圈虽然黑了点, 按照绯闻选出的图基本上可以保证是二部图.

Basic Idea:

以我目前的信息收集能力和我对国内娱乐圈的了解程度, 要完成这样一个工作是很难的, 因此我希望这项研究能够大致这样进行.

  1. 规定一个顶点集合, 这样选择图的时候不至于太大. 我目前选择 百度贴吧->华人明星作为我顶点集合的超集. 考虑到有些娱乐圈人士并不是和娱乐圈内部人员发生绯闻(e.g. 李湘李厚霖, 章子怡 霍启刚 郭晶晶), 因此此集合可以拓展, 只要保证每个拓展点都和我定义的顶点集合有至少一条相邻边. (PS: 上边两位男士都不止一条). 我最终的计划是能够找到300-400个顶点, 如果更多就更好了, 不过我真的怀疑能不能找到这么多的八卦. 我宁愿相信这个图是稀疏图.

  2. 所谓的有绯闻, 这里要给出标准的定义: 如果有具体的新闻报道说某两人发生绯闻的, 算发生; 疑似发生的, 我会用Google确认. 为日后避免争议, 我会保留相关一些新闻报道. 如果两人已经结婚(王菲 李亚鹏)或者发生过婚姻关系(王菲 窦唯), 算发生. 凡发生绯闻, 无论一次或多次(谢霆锋 张柏芝) 都算发生 在两个顶点之间连一条边.

  3. 为避免时间长了这个图越来越大变成二部完全图(好像没有可能就是了), 绯闻数据截至到今年年末, 即使2007年第一场绯闻, 对不起, 我们的图不再收录.

My Current work and funding

目前我以王菲和谢霆锋这两个通常的绯闻中心往外 目前已经收集到近三十人. 我会在下面的一个星期中继续收集, 并画出二部图. 但是我没有时间和精力天天在网上找绯闻. 因此我需要大家帮忙. 我自己给自己定了一个funding: 100$. 如果有人给我送来数据, 我最后一定会寄给你一张支票[在美国或加拿大] (按照给我数据数/我收到数据总数). 如果在中国, 我会考虑回国后请你吃一顿. 如果你也是因为对八卦的乐趣加入这个计划, 我可以把最后汇总的八卦表发给你, 相信应当是最最全的.

还有, 一旦图制好, 我会隐去人名, 并且按照Stanford Graphbase格式写好数据文件让感兴趣的人随便下载. [Of course 带人名的表你也随时可以问我要]

Data Format

请提供如下格式的信件(发送到 youxu AT wustl.edu )或者回帖

某人:某人

[weburl]

烦劳信件按照上面的格式写一下, 中间的标点 “:” 可以中文可以英文. 注意明星的名字尽量不要写错, 我这边是电脑处理, 写错了就要加节点了. 如果有可能, 最好提供一下新闻出处(写在方括号中). 要不然真的要把我从研究生活活逼成一个小报记者了.

Appendix

目前我收集的人名有:[排名不分先后]

王菲 窦唯 李亚鹏 周迅 李大齐 瞿颖 黎明 舒淇 谢霆锋 高圆圆 张亚东 徐静蕾 王朔 张柏芝 陈冠希 陈晓东 陈小春 梅艳芳 郑秀文 卢巧音 章子怡 霍启山 郭晶晶 秦海璐 李湘 李厚霖 …

我知道的都是报纸电视上天天说的有名的 还有一些我不熟悉的 请大家多多提供信息

Oct 14, 2006 - YouTube 神话与其他

Comments

Google 不久前收购了YouTube, 令人费解的是: $1.65 billion

Google 很有钱, 但是为什么会花上这么多钱收购一个还没有盈利模式的公司?

这么多年, Google 的 Viedo一直半死不活; Orkut社区也远远不如想象的好. Google对做技术做平台很擅长, 可是不知道为什么, 对做内容做社区没有什么好的招数(当然Google Group很繁荣, 但那不是Google 经营的社区). 新闻集团早就放出话要收购了, 这次这么高的价格 肯定是竞争的结果.

在此之前, Google收购了很多公司(主要得益于高的股价), 但是大部分都是和提升Google自己产品体验相关的 而且都是小公司 比如Sketchup. Google 还买了很多技术 还从一个以色列学生那儿买了算法, 这些都是技术方面储备性质的投资, 而且startup公司都不会有很高的价格收购.

Google 还投资了一些公司, 但是基本上都是和商业策略有关, 比如买了时代华纳一些股份 百度一些股份等等. 这些投资都是为以后的合作打下基础的, 倒不是什么很大的投资.

但是这次收购YouTube, 简直可以说是一个神话. 前几天才有人质疑说YouTube没有模式盈利, 傻子才会买, 结果没几天就这么高的价格. 互联网的确是泡沫啊, 想想两年前Orcale 强买 Peoplesoft, 那也不过才 $10.3 billion (当时股价是20多美元, Oracle 应该还付出了一大笔现金. 想想Oracle 在数据库和企业软件行业要打拼多少年才能赚到这么多钱.) Google 为什么要买呢? 法国有个谚语说: 傻子不知道什么事情是可以做到的, 所以他做到了. Google不是傻子, 自然不会是因为这个才买的, 在我看来, 原因是竞争.

或许Google是互联网的老大, 但是和那些传统的传媒企业比起来, 在以后竞争上未必能赢. 你说一个传媒一个互联网, 他们竞争什么呢? 说实话, 谁会相信Google的终极目标是” 整合全人类信息并为人类共享”, 在我看来就是 “整合全人类广告并准确无误的送到想看广告的人面前” 至于信息整合, 只是副产品而已了. 为什么Google这么好, 好好的硬盘给我们存邮件 存语音信息 存电子表格 存文档 存照片 存日历 做网页 写Blog 交朋友 聊天, 让你查网页 找图片 读新闻 买东西 搜桌面 查地图 写日记, 让你下代码 看论文 看股票 上论坛… 还不就是把你的信息充分收集. (oh my god, 我出了吃饭睡觉不要Google 我其他时候都是靠它) 既然Google 想要收集更加多的内容, 他就肯定会和做内容的公司形成竞争 此其一.

其二, 一个公司做大了 就会阻碍别的公司进入这个行业. 不要以为Google 很酷就会一直领先. 其实Yahoo, 微软 还有数不清的公司 都是非常有力的竞争者. 拿Yahoo说吧, 我们用的Flickr, del.icio.us 都是黏性非常强的社区. 有了这些社区, Yahoo不愁发展不了相关的搜索. 一个是拥有自家网站的搜索, 一个是没有内容在互联网上抓瞎的搜索, 你会偏好谁呢? 有了内容才有技术这是真理. Google Yahoo都知道搜索这个行业太惨烈了, 技术不可能永远为王, 到最后大家结果各有千秋的时候靠的就是黏性和分众. Yahoo 有门户 有社区 在美国传统用户非常多. Google 也想争取黏性. 终于, 在Group -> Blog ->Pictures 后 下一个有很大黏性的东西出来了, 就是Video.

为什么这么说呢? 所谓的黏性 要求用户不断贡献内容 用户不断访问. 我们说豆瓣很好, 2.0的典范. 但是豆瓣的黏性有没有Blog社区大呢? 相对来说小一点. 豆瓣是基于音乐 电影和书籍共享评论的网站, 我每次看电影之后 都会上去看看别人的评论, 应该说我是用户了. 但是我贡献内容的频率不高. 总要看个电影 看个书 才能贡献内容的. 内容的分众性很好 黏性就不一定了. 无聊的人可能会天天在BBS的十大上回个贴 灌个水 却不可能老在豆瓣玩. 但是Video的黏性很大. 有人要说了, 看来你的黏性=娱乐. 不完全是. 黏性意味着你闲的时候能想到它. 好比你喜欢某个人, 你一个人的时候就会想到她. 黏性意味着这个东西成了你生活的一部分, 就象一些人喜欢天天看博写博一样. 豆瓣已经是很有黏性了 我看电影后肯定会上去看看影评, 但是无聊的时候我还是看看YouTube上面的Top打发时间 或者看书 看digg. 这个黏性就不一样了. Video为什么黏性大, 第一是Video很快餐, 没有层次感和强烈的分众. 我才说了分众好的, 怎么又说分众不好呢? 分众能吸引长期用户, 但是也能排斥非受众用户. Video这东西老少皆宜, 看看图像也没有什么技术门槛, 也不像看Blog 耗眼睛, 因此很多人第一眼见到YouTube就会记住它, 记住这上面有很多好玩的东西. 没有层次感意味着内容的直接呈现 意味着某种程度的推送 而不是自己去找. YouTube在这方面技术上很成熟, 比如可以嵌入任何网页, 可以选择相关影片等等, 让用户轻松点击(甚至不需要点)就能够看到想看得影片 这一点是绝对粘住人的.

第二是Video很多元[或者说社区多元]. 既能服务大众 又能让小众获得享受. (其实互联网是肮脏的, 不知道那些成人内容在YouTube上被观看了多少比例, 我想肯定很多). 我可以在此上找到喜欢的Talk Show, 有人喜欢在上面看动漫(同时也热衷上传). 多元化使得各得其所. 其实这个地方我们忽略了YouTube成功的一个最重要的因素: YouTube技术很好! 如果不能在Flash上做出这么好的播放器 这一切都是说说罢了.

那么多的视频播放网站, 为什么只有YouTube看上去很繁盛的样子? 我要继续我的谬论了, 我认为, 有这三点:

  1. YouTube 本质上不限制版权问题: 盗版的社区肯定是最最繁盛的 [出了传统传媒开的 其实基本上都没有人限]

  2. YouTube 本质上限制了影片的下载, 但是可以轻松嵌入任何的浏览器(这一点制关重要, 用户一方面能够没有限制的欣赏影片 另一方面在看完影片后很有可能会点击最后的链接继续看 还保证用户不会离开YouTube, 就这一点技术上就比很多视频网站要好, 很多视频网站还是依赖wmv, real等格式, 用户会把内容全部抓下来看 从而失去黏性; 或者被盗链, 默默贡献的带宽得不到回报).

  3. YouTube 善于通过Web2.0社区宣传. Web2.0公司强调要建立社区, 这些公司之间也应当是社区的关系 而不是不相往来. 我第一次知道YouTube是通过digg. 相信digg的用户最后都成了YouTube的用户. 中国还没有digg这样的社区. mop很娱乐 做的是自己的影片格式 似乎也不能轻松弄到外面去(要插件才能放, 这个年代FF上插件本来就少 IE提到插件就头疼 Windows遇到重量级插件就要送错误报告, 相比之下一个善于轻量级的善于通过web2.0社区宣传自己的web2.0网站就这样活下来了)

Google 抢来黏性做什么呢, 无非就是要投放更加精准的广告, 然后工程师的副产品就是好的视频搜索. 这下世界疯狂了, 理论上说 Yahoo不想继续收购, 其实Yahoo自己是有Video的. Yahoo不喜欢收购太大的, 因为自己这几年不算太有钱. 不过Yahoo已经有del.icio.us MySpace 和Flickr 三把好刀 Google 怎么处理版权问题也是亟待解决 YouTube本身也没有盈利 Yahoo说不定也不着急这个.

不过可以猜想 中国的一些网站又要泡沫了. 哎 中国互联网那么小公司 什么时候也出个大点的收购才好. 得, 我也泡沫一把, 写我自己的网站程序去了.

Oct 10, 2006 - 要考试了

Comments

终于迎来考试了 Advanced Algorithm

听说研究生最多只能两个B(一共六门必修的), 好怕怕…

这周要做Presentation, 老板交待的事情还没有做,又跑过来上网了, 唉, 有点上网成瘾了…

不行, 决定到周六之前不写Blog了.

Oct 8, 2006 - 这几年的脚印

Comments

整理资料的时候,可以发现我在百合用过的签名档和说明档 一一列举如下 可见我的成长历程.
(小百合04年4月遭遇浩劫一场,之前签名档无法一一找到)

历程1, 04年上半年, 即大二下学期。
背景事件: 和女朋友分手, 学习Java, 写作模拟股市。 极端自傲与极端自卑的结合体

日期   昵称  签名
Mar, 2004: Applet  张狂是我本色,惹我等于自杀!
Apr, 2004: Applet  谦虚谨慎,不骄不躁。
Apr, 2004: Gamelan 沉默是金
Apr, 2004: Guru    剑久封之在鞘兮,虽尘覆其犹利

这段时间, 可见Java成长最为迅速, 从Applet, 到Gamelan, 到Guru, Java成长很快
消失期: 2004年4月-2004年12月: 天天在图书馆看书, 闲来打球, 不上百合.

Dec, 2004: Guru    雄关漫道真如铁,而今迈步从头越。

出来冒了几次泡, 要考G, T, 基本不上百合, 发帖以在Java版回答问题为主, 此时Java颇见功力。
后来考完G后一段时间签名是 "过了黄洋界,险处不需看",可惜找不到了。

Nov, 2005: Guru    雄关漫道真如铁,而今迈步从头越。
Nov, 2005: Guru    下面是我一般使用的及时通讯工具,你可以用任何一个找到我...
Dec, 2005: Guru    自从有了IM I and May 的故事就开始了
Jan, 2006: Guru    务必保持谦虚谨慎、不骄不躁的作风,务必保持艰苦奋斗的作风!

考研出国工作压抑期:其中05年末考研之前最为难熬, 真想找人说说话。后来GF一直很鼓励我 因此改了签名,

Mar, 2006: Guru            有时候先飞的笨鸟被当作牛人,可是笨鸟自己知道,如果停止了飞翔,就会远远落后!
                           我是笨鸟,只能先飞!
Apr, 2006: Dive into Google 先飞的笨鸟, 飞呀飞也飞不高.
May, 2006: 柳暗花明          先飞的笨鸟, 飞呀飞也飞不高

3月, 考研成绩揭晓; 四月 Google面试; 五月, 决定到Wustl. 人生变化很快,提醒自己戒骄戒躁。

后记:

我是个平凡的人, 虽然在别人眼中看来我的2006年很传奇。
拒了微软; 发了论文; 拒了北大; 见了李开复却终止了Google的最后一轮面试;
在西门子实习过; 在创业的小公司待过; 还在医院里略微看了一点生物医学成像项目。
或许在别人眼里是这样的, 我却认为坚持不懈的努力+对自己勇敢的挑战 才是我成功的最大原因。

我是一个不服输的人. 
高中的时候, 班主任很委婉的对我说, 数学竞赛太难了, 你要是搞化学竞赛早就拿奖了.
可是我很倔强, 觉得我一定能做到; 于是, 成功似乎扑面而来, 数学竞赛和计算机竞赛同时拿了奖, 加了分.

语文老师说我作文写的有点像玻璃屑, 看上去闪闪发光, 读起来满嘴鲜血.
我很倔强 我觉得我可以写好作文, 结果我的高考作文满分, 在报纸上登作范文.

高考之前我拿到了南大的保送, 可以去读强化班, 我们班主任很关心我, 说你就去吧。
我知道老师们都认为我成绩不够好,这是绝佳的机会了。我很倔强, 放弃了。
高考的时候, 我是我们班第一, 全省前150, 其中数学还意外失手.

我很倔强, 别人说我和GF两地恋不能维系的时候, 我们默默维持了4年 克服了数不清的压力和诱惑.

我很倔强, 我来到南大浦口的第一天就对自己说
"这个学校的图书馆不比我们高中大多少, 因此我要把计算机类的书全部读一遍" 我做到了.

人家都说本科生发论文太难了, 我不知道有多难, 因此我做到了.

别人告诉我微软 Google的面试题很难, 我没有概念 不紧张 大部分都解决了

我知道同时找工作 考研 申请出国很难, 可是我要挑战一下. 感谢上天的眷顾 父母赐予的智力和GF的鼓励 我都做到了。
...

我想说: 世界上没有什么事情是容易做到的。别人看到的或许是我简单的成功的时候,我看到的是我自己的热血 荆棘 汗水和泪水
 没有一种成功是上天轻松赐予的, 总是要付出的. 当我倔强的时候, 我付出的是更多的努力 更多的时间。
 或许上天还是很眷顾我的, 想比于我的成功, 我知道我的运气也是非常好的。然而上天只会眷顾那些敢于准备的人吧?

在这条人生的路上, 我会遇到很多的问题, 很多复杂的问题, 远远胜过我能回答的范围。
可是我知道, 只要我不停的努力, 到时候一定是有准备的, 就像我面对的任何一次面试一样, 我必须让自己有底,才能祈求运气.

感谢我的父母 感谢帮助我的朋友 也感谢我的女朋友 其实你们才是所谓的冥冥中的带给我运气的人, 我偏执, 但我全心的爱着你们.