Apr 12, 2007 - 推荐阅读: 砍柴不误磨刀功

Comments

李笑来老师是新东方的一个老师,我不认识。昨天从霍炬的Blog中连过去,一下子就喜欢上了他的一篇文章: 砍柴不误磨刀功。

他提到, 虽然说磨刀不误砍柴功,我们常常能看到的却是很多人天天“磨刀”却从不“砍柴”。 这样,怎么能保证自己磨出一把好刀,而不是把可塑之降魔杵磨成了一无是处绣花针呢?

他提到了两个例子, 一个是一本书中的一句话:经过多年观察,我们发现,最悲惨的事情莫过于大量的人正是由于没有目标所以才一直处于学习阶段之中。 是啊,学习变成了社会的正确价值选择, 好像只要你在磨刀,就是对的, 就是准备砍柴的, 可是有没有人好好想想,我这把刀,到底是不是要去砍柴呢, 将来是要去砍什么样的柴呢? 如果前面没多少荆棘的话,先揣一把钝刀,使用时候越来越快,可能也是一个方法。 另一个例子是丁磊。大家都知道,丁磊没有搜狐张朝阳那样显赫的海龟背景,也没有新浪那么好的政府关系,可是三大门户中,作为企业最成功的是网易。 他想做营销,但是他不懂,他不是报个MBA 躲到学校躲几年,而是通过关系先找到段永平这样的能人帮助,然后一边实践,一边学习。 从这件小事情也可以看出,丁磊是个真正的商人,是个做大事情的人。

结合我自己,我大学四年的经历让我明白两个道理,第一是有机会一定要尝试一下,不要错过机会;第二是先做出东西,让他能跑起来,再想着怎么把这个东西做完美,而不是空想了一个月结果没时间做了。 现在想想,其实第二点就是砍柴不误磨刀功。我们从小接受的教育就是要完全准备,不打无准备之仗,强调知识积累,不讲挑战和实践。有句话叫没有金刚钻,别揽 瓷器活,其实回来想想,或许你本来就是金刚钻,只是环境和机遇暂时没有眷顾你,使得你认识不到自己。既然有了瓷器活,上去揽一揽,就知道自己是不是金刚钻 了,再说年轻人,就算有点失败,回头一看,路还和天一样宽呢。

我推荐大家去读这篇“砍柴不误磨刀功”。李笑来老师在新东方想必阅学生无数,说的很有道理,很符合很多人的实际。

Apr 10, 2007 - 关于版权说几句

Comments

今天关于输入法网上流行一篇文章,叫谷歌输入法,是个丑闻</wbr>,但和版权无关。这个事情我已经说了很多话了,不想继续说两家公司</wbr>了。不过作者说词库属于数据库范畴,所以和版权保护不大一样</wbr>,在我国不受保护。本来看过就算的,可是让我担心的是这篇文章被k</wbr>eso推荐阅读,也在奇迹上发表了,也就是说非常多人会读到</wbr>。我觉得在这个问题上我有点不同认识,想说一下。

  1. 从技术角度说,词库不是一般意义的数据库。

为什么呢,词库的确是个数据库,但是这个数据库不是把网络上所有词</wbr>放在一起就行了,如果认真研究谷歌词库的格式,就会发现当中有一个</wbr>项是词频,还有一个项是注音。因为这两条,这个数据库的意义就不一</wbr>样了。为什么呢,举个例子吧,假设Google 没有PageRank, 自己把所有网页抓起来,建了一个数据库,那么,这个数据库是符合辛</wbr>勤采集原则的,因为网页目录仅仅是一个目录,因此很难说Yahoo</wbr>!对网页目录有版权,或者Google 和其他公司有版权。但是这个词频就让数据库的意义变了。为啥呢</wbr>,可以想像,到底是PageRank是Google搜索质量的核心</wbr>呢还是Google的海量数据库呢,答案当然是前者</wbr>,因为假设Baidu也拿到了PageRank, 理论上Baidu 也能做出一样的质量。那么,附加在网页库上的PageRank 指标能不能被保护呢,要不要被保护呢。当然要,因为这个数据是支撑</wbr>Google 质量的灵魂。同样,词频是支撑输入法首字正确的灵魂,因此</wbr>,当一个数据库中包含自己生成的数据的时候,就不是辛勤采集原则了</wbr>。好比咨询公司的市场调查报告中估计了各个公司以后的发展方向</wbr>,财务走向,那么这就不是简单把财务报表放在一起的数据库</wbr>,而是带有自身贡献的受法律保护的作品了。

  1. 数据和算法代码的不可分性

输入法这个例子很特殊,而且为了自定义词库扩充,技术上把算法</wbr>代码和词库分开了。那么,分开的受不受知识产权保护呢</wbr>,答案是肯定的。一来,sogou 没有单独发布这个官方词库作为一个开放数据库,而是作为sogou 输入法这个产品的部件发布的。二来无论怎么说,这个库有EUL</wbr>A, 谷歌没有遵守。如果举证恰当,这个侵犯著作权的官司谷歌肯定吃亏</wbr>。三来,只是在这个特例中词库是纯文本易于获得的形式</wbr>,试想如果sogou 把这个词库封装成dll的话,对他的使用就构成软件反向工程和著作权侵犯了。按照我们国家一般对软件的规定,封装成目标代码的模块和原模块是</wbr>同一事物。法律也不会因为不同的封装形式作出不同的判定。 因此,从这个意义上说,只是这个判例形式特殊</wbr>,本质上sogou 的词库的确属于软件产品的一部分,具有不可分性,并不能用法律上不</wbr>完善的数据库资源来界定。

  1. 中国网民相关知识的缺乏

由于中国的开放源代码运动不如国外,盗版软件使用非常多</wbr>,再加上教育本身不强调公开可获得与公开可利用的区别</wbr>,造成很多GFan 对这个事情有误解。我举个小例子,假如你使用了国家统计局的一些资</wbr>料写一篇报告,在美国,你必须自己转述这些话,而不能原样抄</wbr>,结尾也要给参考文献,尽管这些资料是公开可获得的</wbr>,你也必须对资料源给出应有的尊重。如果资料源公开且声明版权</wbr>,那么使用时必须遵循版权声明。以前大家有个错误的观念</wbr>,认为公开发表的资料是随意可以拿来修改再发布的</wbr>。开放源代码运动就会告诉你,修改再发布必须要遵循怎样的原则</wbr>,商业用途和非商业用途的区别在什么地方。再说个例子或许更好理解</wbr>了,珊瑚虫QQ做的很好,裁剪原来的QQ, 添加新功能,然而,腾讯并没有授予珊瑚虫修改再发布部件的权利</wbr>,因此这个官司显然会输掉。 现在帮谷歌在版权问题上洗白已经是徒劳了,只希望他们两家好好协商</wbr>把这个事情处理过去。

提醒大家:sogou 输入法词库不是简单的数据库资料,作为软件部件一样受法律保护</wbr>,这个不是Google快照那些层次的版权争议,这个是软件著作权</wbr>层次的,这个上面,谷歌是理亏而且法律上无法反击的</wbr>,只要sogou 举证到位,谷歌法律上麻烦比较大。

Apr 10, 2007 - 酷Linux 专栏: Linux 和音乐潮流-1

Comments

题外话: 作为一个坚定的*nix系统使用者,我常常向我周围的人推荐使用L</wbr>inux/UNIX, 而他们通常都以不熟,不好用拒绝我,即使我答应帮他们装Linux系统</wbr>。他们总认为Linux难用,可是事实不是这样的</wbr>,给发展中国家使用的一百美元笔记本(OLPC)上就是 Linux</wbr>, 世界上最眩的操作系统 MacOSX 底下也是UNIX/BSD. 有时候 Linux/UNIX 缺少的就是一些日常应用的杀手级程序。实际上杀手应用甚至决定了系统选择: Apache 让很多人再也不用 Windows 架设服务器,iPod 让美国很多人转而投身苹果。同样,我觉得我们支持Linux的人或许可以</wbr>换一个角度,举出一些 Linux 能做的强大的酷的事情</wbr>,让更多的人了解这个系统,从而爱上这个系统。其实从我的角度看</wbr>,系统不酷,而是工作效率高,不过为了吸引一些用户</wbr>,我不得不从酷的角度去说服别人。因此我准备开一个专栏</wbr>,专讲在Linux下面可以做在Windows下做不到的酷事情</wbr>,希望有人因此喜欢上 Linux. 这个专栏的文章都不长,技术都不复杂,以吸引人为主。如果你想感受Linux, 网上现有的怎么装的教程很多,也可以用LiveCD, 不过那不是我这个专栏所能讲清楚的。我的主要目的是吸引对 Linux 没感觉的人到 Linux 平台 :)

好吧,先说我抓音乐的小例子。我来到美国之后</wbr>,感觉要融入美国文化,首要的就是融入潮流文化. 于是,我开始到网上找哪些音乐电影流行,我就拿下来看</wbr>。这个当然要被很多人鄙视说俗了,现在流行的是小众小资的东西了</wbr>。不过既然俗,咱也得俗的有技术含量是吧。一开始</wbr>,我每天看Google Music Trend, 看到新的歌我就下载,然后用文本文件存我下了哪些歌。因此</wbr>,第一步,我只需要一个浏览器。然后我就发现人工管理的缺陷的</wbr>,因此我就想自动从Google Music Trend 中把我的歌生成一个列表。在这一步,我使用了我需要一个Linux 命令叫 wget, 简单的说,

wget some_url

就可以把一个网页或者资源下载到自己机器上。

好,我们先试验这个命令:

wget http://www.google.com/trends/music -O music.list<br />

-O 表示另存为后面的文件,简单吧。

然后,我们再学一个命令叫cat. cat 不是小猫,是把文件的内容输出到屏幕. cat 后面可以接多个文件,具体可以用 cat –help 看帮助。这个地方,我们用 cat filename 输出文件。`题外话: 作为一个坚定的*nix系统使用者,我常常向我周围的人推荐使用L</wbr>inux/UNIX, 而他们通常都以不熟,不好用拒绝我,即使我答应帮他们装Linux系统</wbr>。他们总认为Linux难用,可是事实不是这样的</wbr>,给发展中国家使用的一百美元笔记本(OLPC)上就是 Linux</wbr>, 世界上最眩的操作系统 MacOSX 底下也是UNIX/BSD. 有时候 Linux/UNIX 缺少的就是一些日常应用的杀手级程序。实际上杀手应用甚至决定了系统选择: Apache 让很多人再也不用 Windows 架设服务器,iPod 让美国很多人转而投身苹果。同样,我觉得我们支持Linux的人或许可以</wbr>换一个角度,举出一些 Linux 能做的强大的酷的事情</wbr>,让更多的人了解这个系统,从而爱上这个系统。其实从我的角度看</wbr>,系统不酷,而是工作效率高,不过为了吸引一些用户</wbr>,我不得不从酷的角度去说服别人。因此我准备开一个专栏</wbr>,专讲在Linux下面可以做在Windows下做不到的酷事情</wbr>,希望有人因此喜欢上 Linux. 这个专栏的文章都不长,技术都不复杂,以吸引人为主。如果你想感受Linux, 网上现有的怎么装的教程很多,也可以用LiveCD, 不过那不是我这个专栏所能讲清楚的。我的主要目的是吸引对 Linux 没感觉的人到 Linux 平台 :)

好吧,先说我抓音乐的小例子。我来到美国之后</wbr>,感觉要融入美国文化,首要的就是融入潮流文化. 于是,我开始到网上找哪些音乐电影流行,我就拿下来看</wbr>。这个当然要被很多人鄙视说俗了,现在流行的是小众小资的东西了</wbr>。不过既然俗,咱也得俗的有技术含量是吧。一开始</wbr>,我每天看Google Music Trend, 看到新的歌我就下载,然后用文本文件存我下了哪些歌。因此</wbr>,第一步,我只需要一个浏览器。然后我就发现人工管理的缺陷的</wbr>,因此我就想自动从Google Music Trend 中把我的歌生成一个列表。在这一步,我使用了我需要一个Linux 命令叫 wget, 简单的说,

wget some_url

就可以把一个网页或者资源下载到自己机器上。

好,我们先试验这个命令:

wget http://www.google.com/trends/music -O music.list<br />

-O 表示另存为后面的文件,简单吧。

然后,我们再学一个命令叫cat. cat 不是小猫,是把文件的内容输出到屏幕. cat 后面可以接多个文件,具体可以用 cat –help 看帮助。这个地方,我们用 cat filename 输出文件。`

cat music.list

怎么样,cat 输出了一个HTML的文件吧。这个HTML文件就是你的浏览器看到的. 然后你要说了,我怎么把这个html文件变成一个格式整齐的列表呢。不着急,下回我告诉你,这次先打一段天书一样的代码(这是一整行内容,注意第一行结束后有一个空格):

cat music.list |tr "\n" " "|egrep -o "song\">[^<]*" |tr ">" "\t"|cut -f 2|sort|uniq >mylist.new

好了,你就发现mylist.new 中全是格式正确的歌曲名了。这段天书怎么理解您无须担心,你可以发现原来在windows下需要copy 20次得到的文本文件一行命令就得到了。那么,学这段天书要多久呢?只要你常来看我的专栏,看三次,每次十分钟,肯定能理解。如果一生做一次,从头学这个天书效率当然不如手工,不过要是天天赶潮流,您就需要考虑用这个命令了。

好了,最后贴出一个喜欢听王小峰推荐歌曲的人要用的一个下载脚本,每次三表同学新歌上线,你轻轻一敲回车,歌曲全到你硬盘,多让人羡慕啊(当然,这个别太传,本来就是偷偷通过他的xml 发现歌曲链接的,传过了三表要发火了)。这个脚本是python 写的,但是因为windows下没有wget, 所以是Linux 专用的 :) 快用这个让美女/闺蜜/帅哥羡慕你吧

``题外话: 作为一个坚定的*nix系统使用者,我常常向我周围的人推荐使用L</wbr>inux/UNIX, 而他们通常都以不熟,不好用拒绝我,即使我答应帮他们装Linux系统</wbr>。他们总认为Linux难用,可是事实不是这样的</wbr>,给发展中国家使用的一百美元笔记本(OLPC)上就是 Linux</wbr>, 世界上最眩的操作系统 MacOSX 底下也是UNIX/BSD. 有时候 Linux/UNIX 缺少的就是一些日常应用的杀手级程序。实际上杀手应用甚至决定了系统选择: Apache 让很多人再也不用 Windows 架设服务器,iPod 让美国很多人转而投身苹果。同样,我觉得我们支持Linux的人或许可以</wbr>换一个角度,举出一些 Linux 能做的强大的酷的事情</wbr>,让更多的人了解这个系统,从而爱上这个系统。其实从我的角度看</wbr>,系统不酷,而是工作效率高,不过为了吸引一些用户</wbr>,我不得不从酷的角度去说服别人。因此我准备开一个专栏</wbr>,专讲在Linux下面可以做在Windows下做不到的酷事情</wbr>,希望有人因此喜欢上 Linux. 这个专栏的文章都不长,技术都不复杂,以吸引人为主。如果你想感受Linux, 网上现有的怎么装的教程很多,也可以用LiveCD, 不过那不是我这个专栏所能讲清楚的。我的主要目的是吸引对 Linux 没感觉的人到 Linux 平台 :)

好吧,先说我抓音乐的小例子。我来到美国之后</wbr>,感觉要融入美国文化,首要的就是融入潮流文化. 于是,我开始到网上找哪些音乐电影流行,我就拿下来看</wbr>。这个当然要被很多人鄙视说俗了,现在流行的是小众小资的东西了</wbr>。不过既然俗,咱也得俗的有技术含量是吧。一开始</wbr>,我每天看Google Music Trend, 看到新的歌我就下载,然后用文本文件存我下了哪些歌。因此</wbr>,第一步,我只需要一个浏览器。然后我就发现人工管理的缺陷的</wbr>,因此我就想自动从Google Music Trend 中把我的歌生成一个列表。在这一步,我使用了我需要一个Linux 命令叫 wget, 简单的说,

wget some_url

就可以把一个网页或者资源下载到自己机器上。

好,我们先试验这个命令:

wget http://www.google.com/trends/music -O music.list<br />

-O 表示另存为后面的文件,简单吧。

然后,我们再学一个命令叫cat. cat 不是小猫,是把文件的内容输出到屏幕. cat 后面可以接多个文件,具体可以用 cat –help 看帮助。这个地方,我们用 cat filename 输出文件。`题外话: 作为一个坚定的*nix系统使用者,我常常向我周围的人推荐使用L</wbr>inux/UNIX, 而他们通常都以不熟,不好用拒绝我,即使我答应帮他们装Linux系统</wbr>。他们总认为Linux难用,可是事实不是这样的</wbr>,给发展中国家使用的一百美元笔记本(OLPC)上就是 Linux</wbr>, 世界上最眩的操作系统 MacOSX 底下也是UNIX/BSD. 有时候 Linux/UNIX 缺少的就是一些日常应用的杀手级程序。实际上杀手应用甚至决定了系统选择: Apache 让很多人再也不用 Windows 架设服务器,iPod 让美国很多人转而投身苹果。同样,我觉得我们支持Linux的人或许可以</wbr>换一个角度,举出一些 Linux 能做的强大的酷的事情</wbr>,让更多的人了解这个系统,从而爱上这个系统。其实从我的角度看</wbr>,系统不酷,而是工作效率高,不过为了吸引一些用户</wbr>,我不得不从酷的角度去说服别人。因此我准备开一个专栏</wbr>,专讲在Linux下面可以做在Windows下做不到的酷事情</wbr>,希望有人因此喜欢上 Linux. 这个专栏的文章都不长,技术都不复杂,以吸引人为主。如果你想感受Linux, 网上现有的怎么装的教程很多,也可以用LiveCD, 不过那不是我这个专栏所能讲清楚的。我的主要目的是吸引对 Linux 没感觉的人到 Linux 平台 :)

好吧,先说我抓音乐的小例子。我来到美国之后</wbr>,感觉要融入美国文化,首要的就是融入潮流文化. 于是,我开始到网上找哪些音乐电影流行,我就拿下来看</wbr>。这个当然要被很多人鄙视说俗了,现在流行的是小众小资的东西了</wbr>。不过既然俗,咱也得俗的有技术含量是吧。一开始</wbr>,我每天看Google Music Trend, 看到新的歌我就下载,然后用文本文件存我下了哪些歌。因此</wbr>,第一步,我只需要一个浏览器。然后我就发现人工管理的缺陷的</wbr>,因此我就想自动从Google Music Trend 中把我的歌生成一个列表。在这一步,我使用了我需要一个Linux 命令叫 wget, 简单的说,

wget some_url

就可以把一个网页或者资源下载到自己机器上。

好,我们先试验这个命令:

wget http://www.google.com/trends/music -O music.list<br />

-O 表示另存为后面的文件,简单吧。

然后,我们再学一个命令叫cat. cat 不是小猫,是把文件的内容输出到屏幕. cat 后面可以接多个文件,具体可以用 cat –help 看帮助。这个地方,我们用 cat filename 输出文件。`

cat music.list

怎么样,cat 输出了一个HTML的文件吧。这个HTML文件就是你的浏览器看到的. 然后你要说了,我怎么把这个html文件变成一个格式整齐的列表呢。不着急,下回我告诉你,这次先打一段天书一样的代码(这是一整行内容,注意第一行结束后有一个空格):

cat music.list |tr "\n" " "|egrep -o "song\">[^<]*" |tr ">" "\t"|cut -f 2|sort|uniq >mylist.new

好了,你就发现mylist.new 中全是格式正确的歌曲名了。这段天书怎么理解您无须担心,你可以发现原来在windows下需要copy 20次得到的文本文件一行命令就得到了。那么,学这段天书要多久呢?只要你常来看我的专栏,看三次,每次十分钟,肯定能理解。如果一生做一次,从头学这个天书效率当然不如手工,不过要是天天赶潮流,您就需要考虑用这个命令了。

好了,最后贴出一个喜欢听王小峰推荐歌曲的人要用的一个下载脚本,每次三表同学新歌上线,你轻轻一敲回车,歌曲全到你硬盘,多让人羡慕啊(当然,这个别太传,本来就是偷偷通过他的xml 发现歌曲链接的,传过了三表要发火了)。这个脚本是python 写的,但是因为windows下没有wget, 所以是Linux 专用的 :) 快用这个让美女/闺蜜/帅哥羡慕你吧

`` print g

a="wget \""+g+"\""

os.popen(a)

注意: 最后三行是有缩进的。可以把这个存成 a.py, 然后 chmod +x a.py. 然后执行 ./a.py 具体的原理我下次讲。如果有问题,请留言。预祝你抓取所有王小峰歌曲成功。

课后作业:

  1. 练习用wget 抓一下 baidu 的500个金曲, 链接是: http://list.mp3.baidu.com/topso/mp3topsong.html

  2. 通过cat 命令研究一下baidu 的 html 和 Google 的 html. 看看哪家的让你觉得舒服. 下节课我们继续讲怎么处理这两个HTML.

下节课预告:1. 那段天书的原理是什么 2. 我怎么抓baidu 的流行榜单

过几天等有时间我还会给大家介绍优盘上的Linux, 光盘上的Linux 和最酷的Linux XGL桌面 还有给基督徒用的Linux 和给学前儿童用的Linux. 其实Linux远比一般人想像的简单而且酷。

本专栏欢迎投稿,暂无稿费。

Apr 9, 2007 - 复活节 独立日

Comments

今天是复活节,我正式从被封的Blogspot 搬家到自己的独立域名: http://blog.youxu.info

以后再也不要担心被封了,现在搬家很方便,那么多文章和评论,一键搞定。

我知道很多同学都是在 MSN 上看我Spaces 更新的,所以无论怎样,Spaces 还保持更新,只是不时会提醒我搬家了 :) Blogspot 已经自动指向新的地址。donews 的备份不再需要,账号我已经放弃,以后就认真经营自己的这个一亩</wbr>三分地了,也不怕被封了。

今天是复活节,也是我的 Blog 独立日。

友情提醒第一次,我的Blog 变成 http://blog.youxu.info 请更新收藏夹。原来使用RSS订阅的请检查订阅的是Feedbu</wbr>rner, 如果是Blogspot,请重新订阅, 如果是Feedburner, 无须更新,我已经重新烧过RSS.

订阅地址是:http://feeds.feedburner.com</wbr>/xumathena (RSS)

Apr 8, 2007 - GuestBlog-7 公共资源和几个网站Beta By Angke Chen

Comments

作者介绍: Angke Chen, 川大-华大(University of Washington)交换本科生,目前在美国交换学习。他关注人类学、社会学和互联网。作为研究人类学和社会学专业的学生,他对互联网有独到的认识,为此他还专门学习了互联网相关的编程设计技术。我几个月前通过搜索引擎发现他的Blog并认识。闲暇时间他喜欢玩mac, 逛digg 和打篮球。你可以访问他的 Blog 或者通过 manchor AT gmail.com 联系他。这篇文章是他庞大的写作计划的一个小部分,因此标题中带一个Beta,他还计划通过对一些社区行为的研究写一篇论文作为这个小 文章的扩充版本, 他对数据挖掘和数据库技术也有研究。各位读者中如果在douban 等社区网站工作或有联系的不妨联系他,他也希望能通过和社区网站的合作得到更准确的社区研究资料并反过来帮助社会网站发展.

本文CC, 署名非商业.

公共资源,被定义成“any goods such that, if any person … in a group … consumes it, it cannot feasibly be withheld from the others in that group” (pp129, Olson) [注: 可翻译为 一切可以不被他人独占而被群体内一切人所使用的资源被称为公共资源]。由此看来,一些网站上的数据,其实是公共资源的一种。比如digg.com上用户提交的故事按照被推荐的数量排序,成为一种公共资源,任何人都可以使用,没有人可以阻止其他人的享用。比如douban.com上用户提交的书评,根据相同的原因,也成为一种公共资源。

当然,这些公共资源因为有数字技术这个载体,具有了一些传统公共资源所不具有的特性。依照Lessig的说法,分为rivalrous和non-rivalrous [注: 可翻译成冲突性和共享性]两种(pp21, The Future of Ideas [1])。大致来说,前者指总量会减少的资源,比如道路资源,有人上路就意味着可以利用的空间少了一些,影响了别人的使用;后者指不会因为人的使用而减少的资源,比如可以复制的DVD等。

digg 和douban 上用户贡献的数据可以归于后一种non-rivalrous 的资源。

non-rivalrous 的资源虽然没有了rivalrous资源在利用上会产生冲突的问题,却同样享有任何公共资源缺乏创造动力的问题。一位用户凭什么要为douban写书评,凭什么要为digg贡献文章或者帮助顶文章?相对应的,toodou.com, zhuaxia.com上都有类似digg的按钮, 用来推荐内容,可是使用者寥寥。

我觉得要说清楚这个问题,需要先将用户分成两类:生产用户和寄生用户。不论动机如何,生产用户产出网站上的内容,而寄生用户被这些内容吸引。举例来说,为digg提供文章的人是生产用户,而仅仅看digg首页的人则是寄生用户,我通常用RSS看digg首页,因此我也算是寄生用户。网站需要生产用户产生资源,才能吸引到大量的寄生用户。我武断的说很多网站,如digg, youtube, flickr的寄生用户数量大大多于生产用户。虽然没有数据支撑,但是我相信这一点很多人不会质疑。

网站吸引贡献用户的手段不同,又可以把他们分成两类。一种是免费提供用户没有的资源,比如在线大容量存储(youtube,flickr, 想想看如果都用.mac来代替前两者的空间,花费会增加多少)。另外一种则是通过建立社区。YouTube 更多时候的用法是上传自己觉得好玩的视频,方便在其他地方的朋友观看。flickr 也是类似。而论坛、豆瓣这些地方,人们更多的是靠社区、第三地方系在一起的。所以论坛会有灌水,而对于豆瓣,很早就有人声称成了豆瓣小组的天下 (要是有机会,一定搜集数据来测试这句话是否正确)。关于第三地点的详细特征,可以参看Ray Oldenburg[3]的 The Great Good Place(Cafes, Coffee Shops, Community Centers, Beauty Parlors, General Stores, Bars, Hangouts, and How They Get You Through the Day),内中虽然是描述咖啡馆、啤酒店的,却和在线社区的特性惊人吻合。

另外一个比较值得注意的现象是,似乎社区和免费提供昂贵资源这两个特征在混合之后比较能够吸引用户,避免网站走上两种极端。比如picasaweb的用户多半就不容易像flickr上一样主动去查看其他用户的照片,而更多的是把它做为纯粹的在线存储,这是因为picasaweb在社区化上做的不够。而如果豆瓣没有书评功能,那么就只能沦为一个一般的社区BBS,在新用户面前完全没有吸引力。

对于社区网站来说,除非你的用户都是一掷千金的人,那么一定要想到一种低价提供昂贵服务的办法,否则吸引新用户会很困难。而对于低价提供昂贵服务的网站来说,最好能够提供一些社区的功能,否则用户只会精明的利用你提供的免费资源,在你风投耗完之前转出数据安全离开。

------

参考书目:

1 Lessig, Lawrence, The Future of Ideas, Random House, 2001.

Olson, Mancur, The Logic of Collective Action

内里有对rivalrous和non-rivalrous资源的分析。

2 Contemporary Sociological Theory, Blackwell Publishing, 2004

内里Olson的一篇文章分析了为什么共同利益在理论上就不容易达到。

3 Oldenburg,Ray,The Great Good Place(Cafes, Coffee Shops, Community Centers, Beauty Parlors, General Stores, Bars, Hangouts, and How They Get You Through the Day)

分析了第三地点(除了工作,家庭的朋友聚会、聊天处,通常是啤酒店,咖啡馆这些地方)对于生活的巨大作用,也解释了这些地点的强大吸引力。虽然描述对象是实体社区,却完全可以看作是对在线社区的一个详尽描述。