<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Comments on: 别拿技术忽悠人</title>
	<atom:link href="http://blog.youxu.info/2007/04/04/gfan_and_guge/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/</link>
	<description>I am Eric, Xu, a Ph.D. student at Washington University. I share my experiences about my life, my universe and everything here.</description>
	<pubDate>Fri, 21 Nov 2008 22:40:30 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6.1</generator>
		<item>
		<title>By: &#187; 眼前有景道不得, 崔颢题诗在上头 &#124; 4G Spaces and Web 2.3</title>
		<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/#comment-3823</link>
		<dc:creator>&#187; 眼前有景道不得, 崔颢题诗在上头 &#124; 4G Spaces and Web 2.3</dc:creator>
		<pubDate>Wed, 04 Jun 2008 01:31:23 +0000</pubDate>
		<guid isPermaLink="false">http://blog.youxu.info/?p=156#comment-3823</guid>
		<description>[...]  一年前我在写别拿技术忽悠人之后, 就想专门写一篇文章, 讲讲中文输入法的实现方法.   后来有人批评小企鹅的代码风格不好, 我还专门看了小企鹅的源代码, 写了不该指责别人代码风格的10个原因. 再后来因为自己的G4老苹果上使用 FIT 输入法速度比较慢,  为了给个别地方做优化, 又细看了 FIT 的源代码,  基本上把 FIT 的架构也弄得很清楚了.  所以, 一直想专门写一篇文章, 讲讲输入法里面的前缀树, 统计语言模型等好玩的有趣的东西. 可是一直拖着, 也比较懒, 就从来没下决心动笔. 我喜欢研究中文输入法的原因也很好理解. 这个东西麻雀虽小, 五脏俱全. 从发展的过程来看, 以前的中文输入法就是字母到汉字的映射, 一点都不能错. 比如五笔型. 后来慢慢的以词为单位的输入, 很多用拼音的人速度开始超过用五笔型的. 再慢慢的, 微软出了微软拼音, 整句输入开始占上风. 打整个句子非常顺畅.  所有的这些, 其实都是底下数学模型的发展和词库数据的不断完备带来的, 虽然一般的用户并不觉察. 现在中文输入法趋势都是基于机器学习中的统计语言模型.  这些一代一代的输入法的变迁, 正好反映了从简单机械的程序到机器学习的应用的变迁.  实现一个输入法, 要比实现一个语音识别简单多了, 但是模型却大差不离.   输入法里几行编程的技巧, 几个简单的模型,  或者小小的数据结构的优化, 都能让效果立刻体现,  因此输入法是一个非常好的学习实验编程和机器学习理论的试验田. [...]</description>
		<content:encoded><![CDATA[<p>[...]  一年前我在写别拿技术忽悠人之后, 就想专门写一篇文章, 讲讲中文输入法的实现方法.   后来有人批评小企鹅的代码风格不好, 我还专门看了小企鹅的源代码, 写了不该指责别人代码风格的10个原因. 再后来因为自己的G4老苹果上使用 FIT 输入法速度比较慢,  为了给个别地方做优化, 又细看了 FIT 的源代码,  基本上把 FIT 的架构也弄得很清楚了.  所以, 一直想专门写一篇文章, 讲讲输入法里面的前缀树, 统计语言模型等好玩的有趣的东西. 可是一直拖着, 也比较懒, 就从来没下决心动笔. 我喜欢研究中文输入法的原因也很好理解. 这个东西麻雀虽小, 五脏俱全. 从发展的过程来看, 以前的中文输入法就是字母到汉字的映射, 一点都不能错. 比如五笔型. 后来慢慢的以词为单位的输入, 很多用拼音的人速度开始超过用五笔型的. 再慢慢的, 微软出了微软拼音, 整句输入开始占上风. 打整个句子非常顺畅.  所有的这些, 其实都是底下数学模型的发展和词库数据的不断完备带来的, 虽然一般的用户并不觉察. 现在中文输入法趋势都是基于机器学习中的统计语言模型.  这些一代一代的输入法的变迁, 正好反映了从简单机械的程序到机器学习的应用的变迁.  实现一个输入法, 要比实现一个语音识别简单多了, 但是模型却大差不离.   输入法里几行编程的技巧, 几个简单的模型,  或者小小的数据结构的优化, 都能让效果立刻体现,  因此输入法是一个非常好的学习实验编程和机器学习理论的试验田. [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Solrex Yang</title>
		<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/#comment-323</link>
		<dc:creator>Solrex Yang</dc:creator>
		<pubDate>Fri, 06 Apr 2007 12:42:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.youxu.info/?p=156#comment-323</guid>
		<description>鸟多了，林子才热闹啊&lt;BR/&gt;也可以从另一个角度看&lt;BR/&gt;不懂装懂的人忽悠够了&lt;BR/&gt;自然会有本来很懂却本来很懒的人出来回击&lt;BR/&gt;这样大家才能更清楚嘛</description>
		<content:encoded><![CDATA[<p>鸟多了，林子才热闹啊<br />也可以从另一个角度看<br />不懂装懂的人忽悠够了<br />自然会有本来很懂却本来很懒的人出来回击<br />这样大家才能更清楚嘛</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Anonymous</title>
		<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/#comment-324</link>
		<dc:creator>Anonymous</dc:creator>
		<pubDate>Fri, 06 Apr 2007 04:59:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.youxu.info/?p=156#comment-324</guid>
		<description>就怕流氓有文化说的就是这个啊。</description>
		<content:encoded><![CDATA[<p>就怕流氓有文化说的就是这个啊。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Eric</title>
		<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/#comment-325</link>
		<dc:creator>Eric</dc:creator>
		<pubDate>Thu, 05 Apr 2007 17:18:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.youxu.info/?p=156#comment-325</guid>
		<description>的确我有不了解的地方，我说的是不要不懂装懂。出了这个领域我也不敢说我全懂，但是我可以肯定的说，拿所谓的技术为技术失误辩护是站不住脚的。懂这些的高手很多，我不敢说我懂多少，但是有些人明显是不懂装懂。</description>
		<content:encoded><![CDATA[<p>的确我有不了解的地方，我说的是不要不懂装懂。出了这个领域我也不敢说我全懂，但是我可以肯定的说，拿所谓的技术为技术失误辩护是站不住脚的。懂这些的高手很多，我不敢说我懂多少，但是有些人明显是不懂装懂。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: aaa</title>
		<link>http://blog.youxu.info/2007/04/04/gfan_and_guge/#comment-326</link>
		<dc:creator>aaa</dc:creator>
		<pubDate>Thu, 05 Apr 2007 16:40:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.youxu.info/?p=156#comment-326</guid>
		<description>好牛啊，这都可以写？你了解多少呢？我怕你也有不了解的地方，这样说会被拍死</description>
		<content:encoded><![CDATA[<p>好牛啊，这都可以写？你了解多少呢？我怕你也有不了解的地方，这样说会被拍死</p>
]]></content:encoded>
	</item>
</channel>
</rss>
