最近很忙, 大致忙以下几件事情.

A: 研究上, 想一个巨难的问题, 编一个巨大的程序,  写一个巨长的论文

B: 生活上, 准备搬家到新地方

C: 课外学习上.

把Lucene 源码看了个底朝天, 实测了好多组件的性能;

研究了一下中文分词, 基本上最近可以做个不那么傻的基于 CRF 或者最大熵的, 准备开源出来给大家用;

派出 Nutch 爬虫抓了某些整站, 抓坏本人硬盘一只, 准备败多台机器+SCSI 硬盘(又缺钱了);

和一个同学学着Django 框架; 推广好几个人转投 Linux 怀抱, 兼写一些开源的文档.

所以, 很忙, 准备 Blog 降低更新频率.