在美国第一次穿雨衣

Oct 16, 2006

Comments

来美国还没有遇到过上班时间下雨的, 今天早上突然很的雨. 以前在电视中看那些老黑带着耳机穿雨衣在雨中漫步,觉得巨无比 ,所以就想特别体验穿一下雨衣. 其实在美国, 雨衣是个比较难找的东西, 穿着不是为了骑自行车走路. 美国人骑车是为了锻炼, 所以小雨不穿大雨不出. 唯一可以用雨衣的时候我想就是游行的时候防高压水龙(或许抗议游行的时候也能防鸡蛋番茄口水)… 估计是因为这个原因 美国的雨衣才设计的”很人性”,像衣服一样有袖子便于你举着口号旗帜或是和人发生物理接触,还有下摆很短可以迅速奔跑, 完全感觉不到行动受限. 刚穿上还小得意了一把, 还想着这雨衣, 风一吹, 一准拉风无比:P. 但是一出门就知道坏了.既然有袖子了, 为什么居然是短袖?$#^@# 难道T恤雨衣很时髦么? 我今天骑车过来前面手臂全湿掉. 还有下摆很小以至于骑车时无法罩住车把, 因此裤子也全部湿透. 本想酷一把结果一到办公室就打喷嚏了, 秋雨果然凉意十足啊.

得到的教训就是: 我要买(汽)车了…


Flash版本的CV

Oct 15, 2006

Comments

在尝试了从txt版本 到Word版本 到Openoffice版 到Html版 到LaTeX版本后, 终于认识到: pdf才是王道.

可惜的是, 人家到你的网站上来看CV, 还要下载. 我知道有些windows用户还要打开巨满无比的Acrobat [还不是Reader, 还是专业版]. 一般情况下虽然pdf很好, 一不小心在IE中点了就开始噩梦, Acrobat插件会把你小硬盘搞的震天响, 最后windows无奈了, 问你要不要往微软送报告.

这一些的噩梦就要结束了, 因为我发现pdf可以转成轻量级的swf啦. 这个工具在window和linux下都有的下载. 叫做 swftools 可以简单的把pdf转化成swf. [Linux用户友情提醒: 注意所有的依赖关系, 要不然通不过编译]

先看效果? 下面就是了:

小提示: 在Flash 上点右键可以选择停止播放, 如果你觉得字太小也可以放大. 感谢秋凌提醒. :)

Tips: You can right click your mouse and make the flash movie stop or zoom in. (Thank Qiuling’s suggestion)

Additionally: I will fix the bugs soon. (So sorry for haven’t done a proof reading)


我要开始一项研究

Oct 15, 2006

Comments

Abstract:

最近在研究图算法和分区, 需要研究把二部图分块. 遗憾的是很难找到非随机的二部图. 在仔细阅读了Knuth的Stanford Graphbase 后, 一个大胆的想法浮出水面: 根据现实某一个模型建立一个二部图. 这个图的节点就是中国当代男女明星, 这个图的边就是: 他们之间有没有绯闻. 先不要批评我八卦, 待我一一说明如下:

Motivation:

因为研究需要, 我们需要建立一个实际(非随机)二部图, 拥有大约300-500个节点. 受Knuth建立非随机二部图启发, 我希望这个图能够来自实际, 易于建立, 并且大家乐于帮我建立. 因此我要想一个让大家愿意来贡献内容的主意. 八卦是人的天性, 追星是人的要求, 因此我希望大家能够乐于告诉我新的节点(你喜欢或不喜欢的明星), 或者新的边(某男某女又好上了). 而且中国娱乐圈虽然黑了点, 按照绯闻选出的图基本上可以保证是二部图.

Basic Idea:

以我目前的信息收集能力和我对国内娱乐圈的了解程度, 要完成这样一个工作是很难的, 因此我希望这项研究能够大致这样进行.

  1. 规定一个顶点集合, 这样选择图的时候不至于太大. 我目前选择 百度贴吧->华人明星作为我顶点集合的超集. 考虑到有些娱乐圈人士并不是和娱乐圈内部人员发生绯闻(e.g. 李湘李厚霖, 章子怡 霍启刚 郭晶晶), 因此此集合可以拓展, 只要保证每个拓展点都和我定义的顶点集合有至少一条相邻边. (PS: 上边两位男士都不止一条). 我最终的计划是能够找到300-400个顶点, 如果更多就更好了, 不过我真的怀疑能不能找到这么多的八卦. 我宁愿相信这个图是稀疏图.

  2. 所谓的有绯闻, 这里要给出标准的定义: 如果有具体的新闻报道说某两人发生绯闻的, 算发生; 疑似发生的, 我会用Google确认. 为日后避免争议, 我会保留相关一些新闻报道. 如果两人已经结婚(王菲 李亚鹏)或者发生过婚姻关系(王菲 窦唯), 算发生. 凡发生绯闻, 无论一次或多次(谢霆锋 张柏芝) 都算发生 在两个顶点之间连一条边.

  3. 为避免时间长了这个图越来越大变成二部完全图(好像没有可能就是了), 绯闻数据截至到今年年末, 即使2007年第一场绯闻, 对不起, 我们的图不再收录.

My Current work and funding

目前我以王菲和谢霆锋这两个通常的绯闻中心往外 目前已经收集到近三十人. 我会在下面的一个星期中继续收集, 并画出二部图. 但是我没有时间和精力天天在网上找绯闻. 因此我需要大家帮忙. 我自己给自己定了一个funding: 100$. 如果有人给我送来数据, 我最后一定会寄给你一张支票[在美国或加拿大] (按照给我数据数/我收到数据总数). 如果在中国, 我会考虑回国后请你吃一顿. 如果你也是因为对八卦的乐趣加入这个计划, 我可以把最后汇总的八卦表发给你, 相信应当是最最全的.

还有, 一旦图制好, 我会隐去人名, 并且按照Stanford Graphbase格式写好数据文件让感兴趣的人随便下载. [Of course 带人名的表你也随时可以问我要]

Data Format

请提供如下格式的信件(发送到 youxu AT wustl.edu )或者回帖

某人:某人

[weburl]

烦劳信件按照上面的格式写一下, 中间的标点 “:” 可以中文可以英文. 注意明星的名字尽量不要写错, 我这边是电脑处理, 写错了就要加节点了. 如果有可能, 最好提供一下新闻出处(写在方括号中). 要不然真的要把我从研究生活活逼成一个小报记者了.

Appendix

目前我收集的人名有:[排名不分先后]

王菲 窦唯 李亚鹏 周迅 李大齐 瞿颖 黎明 舒淇 谢霆锋 高圆圆 张亚东 徐静蕾 王朔 张柏芝 陈冠希 陈晓东 陈小春 梅艳芳 郑秀文 卢巧音 章子怡 霍启山 郭晶晶 秦海璐 李湘 李厚霖 …

我知道的都是报纸电视上天天说的有名的 还有一些我不熟悉的 请大家多多提供信息


YouTube 神话与其他

Oct 14, 2006

Comments

Google 不久前收购了YouTube, 令人费解的是: $1.65 billion

Google 很有钱, 但是为什么会花上这么多钱收购一个还没有盈利模式的公司?

这么多年, Google 的 Viedo一直半死不活; Orkut社区也远远不如想象的好. Google对做技术做平台很擅长, 可是不知道为什么, 对做内容做社区没有什么好的招数(当然Google Group很繁荣, 但那不是Google 经营的社区). 新闻集团早就放出话要收购了, 这次这么高的价格 肯定是竞争的结果.

在此之前, Google收购了很多公司(主要得益于高的股价), 但是大部分都是和提升Google自己产品体验相关的 而且都是小公司 比如Sketchup. Google 还买了很多技术 还从一个以色列学生那儿买了算法, 这些都是技术方面储备性质的投资, 而且startup公司都不会有很高的价格收购.

Google 还投资了一些公司, 但是基本上都是和商业策略有关, 比如买了时代华纳一些股份 百度一些股份等等. 这些投资都是为以后的合作打下基础的, 倒不是什么很大的投资.

但是这次收购YouTube, 简直可以说是一个神话. 前几天才有人质疑说YouTube没有模式盈利, 傻子才会买, 结果没几天就这么高的价格. 互联网的确是泡沫啊, 想想两年前Orcale 强买 Peoplesoft, 那也不过才 $10.3 billion (当时股价是20多美元, Oracle 应该还付出了一大笔现金. 想想Oracle 在数据库和企业软件行业要打拼多少年才能赚到这么多钱.) Google 为什么要买呢? 法国有个谚语说: 傻子不知道什么事情是可以做到的, 所以他做到了. Google不是傻子, 自然不会是因为这个才买的, 在我看来, 原因是竞争.

或许Google是互联网的老大, 但是和那些传统的传媒企业比起来, 在以后竞争上未必能赢. 你说一个传媒一个互联网, 他们竞争什么呢? 说实话, 谁会相信Google的终极目标是” 整合全人类信息并为人类共享”, 在我看来就是 “整合全人类广告并准确无误的送到想看广告的人面前” 至于信息整合, 只是副产品而已了. 为什么Google这么好, 好好的硬盘给我们存邮件 存语音信息 存电子表格 存文档 存照片 存日历 做网页 写Blog 交朋友 聊天, 让你查网页 找图片 读新闻 买东西 搜桌面 查地图 写日记, 让你下代码 看论文 看股票 上论坛… 还不就是把你的信息充分收集. (oh my god, 我出了吃饭睡觉不要Google 我其他时候都是靠它) 既然Google 想要收集更加多的内容, 他就肯定会和做内容的公司形成竞争 此其一.

其二, 一个公司做大了 就会阻碍别的公司进入这个行业. 不要以为Google 很酷就会一直领先. 其实Yahoo, 微软 还有数不清的公司 都是非常有力的竞争者. 拿Yahoo说吧, 我们用的Flickr, del.icio.us 都是黏性非常强的社区. 有了这些社区, Yahoo不愁发展不了相关的搜索. 一个是拥有自家网站的搜索, 一个是没有内容在互联网上抓瞎的搜索, 你会偏好谁呢? 有了内容才有技术这是真理. Google Yahoo都知道搜索这个行业太惨烈了, 技术不可能永远为王, 到最后大家结果各有千秋的时候靠的就是黏性和分众. Yahoo 有门户 有社区 在美国传统用户非常多. Google 也想争取黏性. 终于, 在Group -> Blog ->Pictures 后 下一个有很大黏性的东西出来了, 就是Video.

为什么这么说呢? 所谓的黏性 要求用户不断贡献内容 用户不断访问. 我们说豆瓣很好, 2.0的典范. 但是豆瓣的黏性有没有Blog社区大呢? 相对来说小一点. 豆瓣是基于音乐 电影和书籍共享评论的网站, 我每次看电影之后 都会上去看看别人的评论, 应该说我是用户了. 但是我贡献内容的频率不高. 总要看个电影 看个书 才能贡献内容的. 内容的分众性很好 黏性就不一定了. 无聊的人可能会天天在BBS的十大上回个贴 灌个水 却不可能老在豆瓣玩. 但是Video的黏性很大. 有人要说了, 看来你的黏性=娱乐. 不完全是. 黏性意味着你闲的时候能想到它. 好比你喜欢某个人, 你一个人的时候就会想到她. 黏性意味着这个东西成了你生活的一部分, 就象一些人喜欢天天看博写博一样. 豆瓣已经是很有黏性了 我看电影后肯定会上去看看影评, 但是无聊的时候我还是看看YouTube上面的Top打发时间 或者看书 看digg. 这个黏性就不一样了. Video为什么黏性大, 第一是Video很快餐, 没有层次感和强烈的分众. 我才说了分众好的, 怎么又说分众不好呢? 分众能吸引长期用户, 但是也能排斥非受众用户. Video这东西老少皆宜, 看看图像也没有什么技术门槛, 也不像看Blog 耗眼睛, 因此很多人第一眼见到YouTube就会记住它, 记住这上面有很多好玩的东西. 没有层次感意味着内容的直接呈现 意味着某种程度的推送 而不是自己去找. YouTube在这方面技术上很成熟, 比如可以嵌入任何网页, 可以选择相关影片等等, 让用户轻松点击(甚至不需要点)就能够看到想看得影片 这一点是绝对粘住人的.

第二是Video很多元[或者说社区多元]. 既能服务大众 又能让小众获得享受. (其实互联网是肮脏的, 不知道那些成人内容在YouTube上被观看了多少比例, 我想肯定很多). 我可以在此上找到喜欢的Talk Show, 有人喜欢在上面看动漫(同时也热衷上传). 多元化使得各得其所. 其实这个地方我们忽略了YouTube成功的一个最重要的因素: YouTube技术很好! 如果不能在Flash上做出这么好的播放器 这一切都是说说罢了.

那么多的视频播放网站, 为什么只有YouTube看上去很繁盛的样子? 我要继续我的谬论了, 我认为, 有这三点:

  1. YouTube 本质上不限制版权问题: 盗版的社区肯定是最最繁盛的 [出了传统传媒开的 其实基本上都没有人限]

  2. YouTube 本质上限制了影片的下载, 但是可以轻松嵌入任何的浏览器(这一点制关重要, 用户一方面能够没有限制的欣赏影片 另一方面在看完影片后很有可能会点击最后的链接继续看 还保证用户不会离开YouTube, 就这一点技术上就比很多视频网站要好, 很多视频网站还是依赖wmv, real等格式, 用户会把内容全部抓下来看 从而失去黏性; 或者被盗链, 默默贡献的带宽得不到回报).

  3. YouTube 善于通过Web2.0社区宣传. Web2.0公司强调要建立社区, 这些公司之间也应当是社区的关系 而不是不相往来. 我第一次知道YouTube是通过digg. 相信digg的用户最后都成了YouTube的用户. 中国还没有digg这样的社区. mop很娱乐 做的是自己的影片格式 似乎也不能轻松弄到外面去(要插件才能放, 这个年代FF上插件本来就少 IE提到插件就头疼 Windows遇到重量级插件就要送错误报告, 相比之下一个善于轻量级的善于通过web2.0社区宣传自己的web2.0网站就这样活下来了)

Google 抢来黏性做什么呢, 无非就是要投放更加精准的广告, 然后工程师的副产品就是好的视频搜索. 这下世界疯狂了, 理论上说 Yahoo不想继续收购, 其实Yahoo自己是有Video的. Yahoo不喜欢收购太大的, 因为自己这几年不算太有钱. 不过Yahoo已经有del.icio.us MySpace 和Flickr 三把好刀 Google 怎么处理版权问题也是亟待解决 YouTube本身也没有盈利 Yahoo说不定也不着急这个.

不过可以猜想 中国的一些网站又要泡沫了. 哎 中国互联网那么小公司 什么时候也出个大点的收购才好. 得, 我也泡沫一把, 写我自己的网站程序去了.


要考试了

Oct 10, 2006

Comments

终于迎来考试了 Advanced Algorithm

听说研究生最多只能两个B(一共六门必修的), 好怕怕…

这周要做Presentation, 老板交待的事情还没有做,又跑过来上网了, 唉, 有点上网成瘾了…

不行, 决定到周六之前不写Blog了.