整一个月零一天前,我在北京和 zuola 老师见了一面,商量怎么恢复 aiweiwei 老师被新浪和谐掉的博客的内容。 因为 Google Reader 这些阅读器实际上缓存了博客的 feed, 而我以前又有专门抓 Google Reader 内容的代码,所以很容易就抓到了所有的数据。

根据我抓到的数据,我说几个统计数据: Aiweiwei 老师从 2007 年 7月22 日 开博一来,到 2009年5月27日被和谐,一共有 1639 篇文章

这 1639篇文章中, 有这样几个数据:

1. 从2008 年 11月 27 日某个一直想要说法的公民死亡开始,aiweiwei 的博客上每天贴了一张 “蜡烛”, 从”一“ 开始到 ”蜡烛 一百八十一 09.05.27“ 结束,中间只缺了 08年12月14日这一天。 我也写博客,我知道坚持一天贴一张图需要的坚持和毅力。 但就这样的贴图,都被新浪删除了不少。

2. “5.12遇难学生名单 补充” 系列,从“一”开始, 到 “一百三十二”, 里面全是一个一个活生生的名字。 这些文章,平均被新浪删除三次,艾未未老师也不和新浪发火,删了三次,就重新贴三次。 因为 aiweiwei 老师把新浪的删除日志也贴出来,所以,像以下这样的句子在我抓到的数据里比比皆是, 比如,数据中有以下这几行:

您的文章《5.12遇难学生名单补充(二) 09.03.17″>已被管理员转移到回收站。给您带来的不便,深表歉意。

您的文章《被删除文章 5.12遇难学生名单补充(二) 09.03.17″><已被管理员转移到回收站。给您带来的不便,深表歉意。

您的文章《被删除文章 5.12遇难学生名单补充(二) 09.03.17″> 已被管理员删除。给您带来的不便,深表歉意。

就 “被删除文章 5.12遇难学生名单补充(二)  09.03.17” 这篇文章, aiweiwei 贴了三次。 像这种文章,一般刚贴出来,新浪就很快删除了,所以我们读者根本看不到痕迹。可是,这些痕迹在 RSS 里面每条都有,所以很容易看到一条条这样触目惊心的删除,贴,再删除,再帖。在看不到数据之前,我们都不知道这样列着遇难学生名单的文章居然能被这样删三次,贴三次。这种持久的删了再帖的耐心,我想普通人是做不到的。

我知道有人不喜欢艾未未老师,以为他是在搞行为艺术,是想出名,看了数据之后,我想至少大家能够对他做的事情多点支持和理解,也就行了。

为了让更多的人看到 aiweiwei 老师在新浪博客上付出的心力和做的事情,我愿意将我抓到并处理后的数据与所有的人分享。 因为数据非常大, 想要的读者请给我发邮件。您拿到数据之后,可以直接导入任何 WordPress 博客。另外,我有一整套的从 Google Reader 恢复 WordPress 的代码,只要您的 WP 博客有人订阅,全文输出,如果数据因为某些原因丢失了, 我的代码可以帮你很快的恢复博客。 稍后等我有空,我会把代码和恢复中的技术要点全部贴出来。

  • lochmeters

    您老blog RSS不能全文输出呀,能不能看一下怎么回事

  • http://blog.so8848.com Jeffye

    此事功在徐老师,利在千万P民!

  • fieldsfarmer

    zan!
    徐宥凭着自己的技术,可协助将国内的一些总被封的人的博客挂到国外服务器上。

  • sswv

    “缺了08年12月14日这一天”为什么偏偏是这一天呵?查查2002年12月14日甘肃玉门地震,那天我可就在震中,那次地震死2人。

  • RightHand

    这个是要赞的
    你回去了吗

  • allen galler

    Nice! 这些数据恢复工作很有意义!

  • 小茄

    您的邮箱是?

  • 小茄

    我是一名志愿者,现在正在做512遇难学生的数据录入工作,我们这一共有5000多个数据。我们的录入网站是www.512students.org

  • Eric

    @小茄
    youxu A@T wustl.edu

  • lbaby

    以为是笑来写的呢,看了一下python 代码,吓一跳
    后来一看,不是。

    讨厌那帮人民财富的管家,没有人监管还真以为自己是 主人了

  • zhangyijun

    Aiweiwei的新Blog的RSS的输出在GoogleReader中格式有问题,建议帮他改进一下,xexie

  • guest

    totally, fully support. Even if you are “US citizen and protect the integrity of US and reputation of US government” (which you aren’t I assume at the moment), I still appreciate and can see your point.

    Some of your article/arguments are controversal or can be easily mis-interpreted, if I may say so.

    I am still having too much time to waste now… Only practical job helps the future, you have done a nice job help AiWeiWei, thanks again.

  • yjpc

    是真做事的中国人!顶一个!

  • http://dylanklc@gmail.com dylanklc

    告诉我aiweiwei的sina url
    或许我能从时间机器里挖点内容出来~

  • http://dylanklc@gmail.com dylanklc

    以前都是拿c写的 没想到想在Google api +python这么容易就搞定了……

  • http://dylanklc@gmail.com dylanklc

    http://web.archive.org/web
    这个时间机器 里能找很多以前的东西.

  • 您好,请发一份给我吧,我现在都只能用代理访问他的国外博客,旧的文章都没有读到,想好好认识艾未未,他的行为给到我的印象就是个好汉

    最近我也读了一些关于公盟的文章,先认识到盲人陈光诚,再看到还有许志永老师,我为他们的正义所感动

    谢谢你的分享~

  • http://2009.07.29 jhqn2000

    请给我也发一份吧,我也要看他的文章,十分感谢!

  • Anonymous

    我的

  • Anonymous

    请给我也发一份,谢谢!

  • http://hi.baidu.com/barnabas liruqi

    这个博客有RSS输出吗?

  • http://hi.baidu.com/barnabas liruqi

    sorry, 看到了..

  • simbablack

    我的电脑以及水平很业余,很可能打不开相关文件,但也还是希望索取一份学习使用
    感谢徐宥的勇气,细心,工作
    再次感谢

  • x

    顶!以中国人的名义!

  • xiaofan

    看了老妈啼花的片子,觉得很震惊,有必要让更多的朋友知道,我们这个社会的真实现状,让更多人参与进来,整个社会都是豆腐渣工程虽不是我们的错,如果现世的人任由这种状态持续,我们都有罪,艾先生第一次才知道他,真是无限惭愧,Google阅读器难订阅他的博客,请将代码发给我,谢谢!

  • sanbu

    谢谢,给我一份吧

  • june

    也请给我一份吧,麻烦您了,谢谢

  • Wei

    曾经挺反感艾未未,他在德国Detail的一期专门介绍中国奥运建筑的文章的前面,发表了对中国政府,现状很可以说听起来非常刺耳可以说是攻击性的批评。而他的在瑞士的事务所却是这些项目的参与者。 看起来是一个“同流合污”的人还要故作清高。
    但是自从道听途说,他曾经说过 “自己就是要像一个傻B一样的站出来的时候“就理解他了,
    他这种态度,不正是很多现在身在海外的中国人对自己国家的矛盾心态的写照,对国内黑暗现状的深恶痛绝,和为自己国家做点贡献的强烈意愿。

  • blocP

    麻烦发来一份 谢谢!

  • kafuka_1

    我也想要一份

  • http://aminby.net Aminby

    good ..

  • http://blog.luofei.org 撒把盐

    你好!感谢你为大家做的一切!
    另请教,我以前有个WP博客更新版本的时候全部变成了乱码,备份也竟然是乱码,当然发现只有google reader里的数据正常,但一天后rss更新导致GR里的数据也变成了乱码。不知“从 Google Reader 恢复 WordPress 的代码”能否起作用恢复早期正常的数据。
    谢谢!

  • robin

    thanks.

  • robin

    这个链接无法访问:http://blog.youxu.info/wufetcher.py

  • http://www.yupengming.com/?p=41 吐泡泡的小鱼 » 【小鱼吐泡】2010.2.25

    [...] 艾未未的新浪博客的一些数据统计 [...]

  • inkfishling

    我想要一份,謝謝!

  • You Xu

    各位朋友,谢谢支持。 为了安全和隐私的考虑,我把带有邮箱的留言都隐藏了。
    如果你需要数据,请在留言的时候填写邮箱就行了,不需要在留言中留下邮箱,
    我在后台可以看到你的邮箱。

    wufetcher 的链接已经修复。

  • 来去自由

    你好,能否也给我来一份,不甚感激!我之前粘贴的艾老师博客里的关于地震及杨佳事件的文章存在U盘里因为中病毒找不出来了,正急呢,想找人复制一份,如果可以帮帮忙,就太感谢了!

  • 来去自由

    可不可以给我也发一份,非常感谢!

  • yuan

    请给我发一份,谢谢!

  • 来去自由

    拜托你了,能不能给我也来一份啊,帮帮忙!

  • BROUS

    你好,我还是环艺专业的大学生,很佩服AIWEIWEI的作品和想法,很多他拍的纪录片我都找不到,您能给我发一些他被河蟹的东西吗,什么都好,楼主好人。

  • 周银子

    您好~麻烦您给我发一份吧~想看看说真话的人的博客!~谢谢分享!!

  • zhyuch

    给我发一份,谢谢!

  • wu ling sheng

    资料索取 感谢 辛苦

  • Maomao

    您做的这件事真是太有意义了. 还互联网一个不受干扰的空间.

  • 123

    yuc200@sina.com 希望了解更多 谢谢

  • wind

    请发一份给我,Thanks!

  • http://zuo.la/ zola

    忘了告诉你了,你导出来的数据放到 http://aiweiweiai.wordpress.com/ 了。

  • http://blog.zuola.com/2010/12/how-to-export-your-blog-article-from-google-reader.htm How to export your blog article from google reader? | Zola's blog

    [...] Xuyou has export Aiweiwei’s sina blog from google reader : http://blog.youxu.info/2009/07/04/aiweiwe/ [...]

  • https://www.zuola.com/weblog/?p=1631 » 如何从google reader里找回BLOG的文章

    [...] 徐宥:艾未未新浪博客的一些数据统计 http://blog.youxu.info/2009/07/04/aiweiwe/ [...]

  • lisa362
  • lisa362

    请发我一份,谢谢了

  • http://about_leon@163.com alone
  • 盒子

    非常想了解真实的情况,希望能得到共享,谢谢!

  • 非暴力改良

    你好 对艾先生的文章知之甚少 但敬重他敢于直面强权般勇气
    请发我一份xgone7777@hotmail.com

  • Rollingworld

    你好 我的邮是rollingworld@live.cn 我想看看艾未未老师的博客 谢谢

  • Sasdadj

    你好 真的很想看看以前的内容,我的邮箱sasdadj@gmail.com 谢谢啦~

  • Longtime999