2016 年,我做过一次 AI 写代码创业

Jan 14, 2026

Source: https://x.com/xleaps/status/2033027083476054377


2016 年,当 AI 还远没有成为今天这样的全民浪潮时,我已经开始认真尝试一件事:用语言模型来理解、修改和生成代码。

我给公司起名叫 ai.codes。这个名字几乎不需要解释:AI codes——把 code 当作动词,意思就是“AI 写代码”。

这个愿景在十年后的今天终于成为现实。“Agentic Coding”的浪潮已经席卷全球。只是当这一切真正到来时,我当年的那次创业,早已停在了 2016 年。

今天我想把这段往事写下来。它既是对那个技术爆发前夜的记录,也算是给 30 岁的自己留下一封迟到的回信。

当年的愿景

当年的愿景

前史:我为什么会相信这件事

2011 到 2014 年,我在 Google 工作。那时我有个习惯:去看 Jeff Dean 最近又写了什么代码。

2013 年夏天,我注意到他在参与一个叫 DistBelief 的项目。那是 Google 早期的大规模分布式神经网络训练系统,本质上是在 CPU 集群上把神经网络的 forward 和 backward 过程做成分布式计算。虽然我当时并不知道 Jeff Dean 最终想把这条路带到哪里,但这件事成了一个契机:我开始花大量时间系统地学习神经网络。

2014 年,我离开 Google,搬到旧金山湾区,加入当时还不算显眼的 Fitbit。

因为此前已经对神经网络的能力有了比较深的认识,所以在 Fitbit 时,我主动把卷积神经网络引入到睡眠周期分类的问题里。Fitbit 是全球最早在可穿戴设备上做睡眠周期识别的公司之一,而我当时带的小组,应该也算是业界较早把卷积网络真正用到这一问题上的团队之一。那时主流方法仍然是特征工程加线性分类器,而我们在实践中很快发现,卷积神经网络的效果明显更好:它学到的信号表示,比人工构造出来的特征更强。

工作上我用的是卷积网络,但真正让我着迷的,其实是神经网络在自然语言处理上的潜力:翻译、理解文本,以及进一步地,理解程序。

我当时特别好奇:神经网络能不能写代码?尤其是那些我认为非常繁冗、复杂度并不高、模式却很多的代码。因为在工作里我常常看到,工程师尤其是做底层系统的工程师,很多时候不是在写配置,就是在写“生成配置的代码”。而与此同时,机器翻译已经开始取得真正的突破。既然 AI 可以做自然语言之间的翻译,那它为什么不能做自然语言到代码的翻译?更何况,很多代码在统计意义上比自然语言更规整、更低熵。

那时候我一直在博客上写《编程珠玑番外篇》,对各种编程语言的特性,以及人类编程过程中的种种困难,也算有不少思考。我逐渐意识到,在 AI 还远不完善的时候,真正可行的路径不是纯 AI,而是把 AI 和编译器技术谨慎地结合起来。

这些朴素的判断、长期积累的技术兴趣,以及对自己工程能力的信心,最终汇成了我创业的起点。

2016 年 8 月,我从 Fitbit 辞职,决定全职去做这件事。

那时候很多人注册的都是 .ai 域名。我偏偏反其道而行,注册了一个我至今仍然觉得很炸裂的域名:ai.codes。意思非常直接:AI 写代码。

第一版产品:从自动补全开始

语言模型和代码自动补全之间的联系,其实是非常直接的。所以我最早做的产品,就是一个更智能的代码自动补全工具,目标很简单:提高程序员在 IDE 里的工作效率。

为此,我下载了当时 GitHub 上大量的开源代码,专门搭了一套后端存储 and 训练架构,并在 GPU 上训练了一个在当时已经不算小的语言模型。它的任务和今天的大语言模型并没有本质区别:预测下一个 token。

2016 年时,Transformer 还没有出现;LSTM 仍然是最现实的序列模型选择。所以我的预测模型最终是一个 4 层 LSTM。现在回头看,它当然还很早期,但在当时已经足够让人震撼。

代码和自然语言相比有一个天然优势:它的下一个 token 往往受到更强的语法约束。比如前面没有出现左括号,后面就不应该凭空出现右括号。所以我当时很自然地加了一层约束:把那些在当前语法位置不可能出现的 token 过滤掉。

今天回头看,这和后来大家熟悉的 constrained decoding 属于相近思路;再往外推,也和后来模型生成合法 tool call、合法 JSON 时用到的约束式生成有共通之处。那时我并没有把它当成什么理论突破,只是觉得这件事太直观了,顺手就该这么做。

很快,我写出了一个 IntelliJ 插件,可以在编辑器里做代码补全。传统 IDE 的自动补全,通常只是帮你补一个函数名,比如你敲出 Array.,它在光标后面补一个候选方法;而我的系统,已经可以补全整段语句。

再往后,又把 Stack Overflow 上大量代码片段抓了下来,做了索引。我发明了一种三个斜线的注释方式:只要你输入一行三个斜线的注释,再回车,比如:

/// 此处我需要把文件内容读成一个列表

AI 自动补全示例

模型就会尝试把这句自然语言翻译成代码。

直到今天,我都记得第一次看到它真正“写代码”时那种近乎魔术般的感觉。其实背后的方法并不神秘:我先从索引里搜索,拿出许多候选代码片段,再让语言模型结合上下文继续生成。最后出来的程序不但语法正确,连变量名都能自动和上下文对齐。今天回头看,这已经很接近后来所谓 retrieval-augmented generation 的思路了。

在 2016 年,这样的效果是相当震撼的。

但我很快犯了一个巨大的错误:我不知道该怎么推广它,也不知道该怎么把它变成收入。

我当时相信,这样的技术只能卖给公司,而且需要结合公司内部代码库做定制化微调,才能真正体现魔力。于是我花了很长时间去向不同公司推销一个大家普遍看不懂、在没有定制化之前也看不出全部价值的东西。除了一些朋友和熟人愿意尝试,我始终没能获得真正的收入。

技术之外,更难的是人和时代

在硅谷,大家常开玩笑说,一家没有收入的公司往往估值最高。但当你做的是一件几乎没有足够多人能理解的事情时,融资会变得异常困难。

我记得有一次坐在一位投资人的办公室里,对面接待我的是一位几乎不了解 AI 技术的斯坦福 MBA。她问我的核心问题不是模型,不是产品,也不是程序员工作流,而是:这个技术能不能卖到中国去赚钱。

她甚至直接告诉我,如果系统还不能理解中文注释,他们就不会投,因为他们背后有中国资本的考虑。

这样的反馈让我很快意识到,问题并不只是我讲得不够好,而是很多人根本不在和我讨论同一个问题。我们嘴上说的都叫 AI,但脑子里想的并不是同一件事。

大多数硅谷投资人对这个方向的前景其实并不悲观,但它在当时实在太超前了,他们需要更多信号。而超前本身,恰恰就意味着缺乏信号。

九月份,我去山景城参加 Y Combinator 的面试。面试时,大家其实都挺喜欢我的产品,但最后的反馈仍然是:需要更多信号,鼓励我以后再来。

The rejection letter from YC

The rejection letter from YC

融资占据了我大量时间,也直接拖慢了产品和市场推进。直到那时我才真正意识到,没有一个合适的共同创始人,会把一家过于超前的创业公司拖入多么被动的处境。

我在 Google 时有一位非常尊敬的同事。我甚至飞回芝加哥很多次,试图说服他加入。但在他看来,这件事太异想天开。后来,我研究生时代的一位同事愿意承担这个风险,可整套技术栈既不是书本上能直接学到的东西,也不是他的博士方向,所以进展依然很慢。

回头看,我能理解这些同事和投资人。他们并不是错了,只是谁都不愿意为一个还没有被时代证明的愿景下注。

于是,那时的现实就是:我几乎一个人扛起了全部——技术、产品、融资、叙事、心理压力,还有生活本身。

那时候我的孩子才一岁多,刚学会走路,天天追着找我玩。我却整天在外面跑。到现在我还记得一个很具体的画面:有一天很晚回到家,妻子和儿子都已经睡着了,小猫蜷在旁边。我站在那里,心里知道自己隐约看见了一幅关于未来的拼图,可现实世界里却始终找不到把它拼出来的下一步。我不断碰壁。融资、合伙人、产品路径,所有未来都隔着一层雾。我父母只会说一句:你别太辛苦。

那种感觉不是简单的辛苦,而是一种更深的孤独:你知道自己看见了什么,但没有办法把它翻译成别人也能相信的语言。而与此同时,你又必须做点什么,才不算辜负那些仍然相信你的人。

创业是怎么结束的

被 YC 拒绝以后,我决定先把产品的不足想清楚。我又做了一些实验,训练了几个小模型,逐渐看清问题的核心:我缺的不是下一个插件,不是下一个 demo,也不是一份更漂亮的融资 PPT。

我真正缺的,是一个更强的模型。更直接一点说,是训练更大模型的钱。

我的模型表现仍然不够稳定,预测经常出问题。我已经把能想到的编译器技巧和语法检查手段都用上了,能补的地方几乎都补过了。剩下的问题,不是工程上的小修小补能解决的,而是模型本身还不够强。

到了圣诞节前后,我认真算过一次:我大概还需要 25 万美元, 以训练这个模型。

这个数字在我看来并不夸张,但在很多 VC 眼里却近乎离经叛道。融资的钱,在他们的想象里应该用来招人、做增长、讲故事,而不是被送进数据中心,最后变成 GPU 的热量。原本他们就不理解这个方向,到了这一步就更加无法理解:为什么我要为一个还不一定成功的模型,直接烧掉 25 万美元。

问题不在于他们是否尊重我,而在于我确实无法在“现有产品”和“如果模型能力跃迁后可能出现的产品”之间,搭出一条足够让他们相信的桥。

我需要钱,才能训练出更强的模型;但我也需要那个更强的模型,才能证明这件事值得投。

现在回头看,也许我还能想到别的路径。比如换一个切入点,先去找那些愿意容忍模型还不够聪明、但依然能从中受益的用户;或者更早围绕工具链、数据 and 工作流去搭一个可以慢慢生长的产品。但当时的我被这个死结困住了,觉得自己暂时推进不下去了。

于是我开始想,也许唯一的办法,是先把手上的技术能力变现,先去工作,等攒够了钱,再回来继续做这件事。

我记得那年圣诞节,经济压力已经非常真实了。我舍不得买圣诞树,直到平安夜前一天,才想起来要给儿子买一个玩具卡车。过完那个圣诞节以后,我终于承认:我不能再这样拧下去了。与其在原地内耗,不如先退一步,等时机成熟,再回来。

于是,我把下载 GitHub 代码后端的整套技术转让给了一家需要它的公司。然后我认定,自己接下来只会去两家公司赚点钱:OpenAI 和 Reddit。

创业规划蓝图

当时拟定的三步走计划, 先做自动补全, 再做小规模填写, 最终达到只用自然语言

OpenAI 与 Reddit

那时候的 OpenAI 还只是一个很小的非营利组织,甚至还要先做一些题,才能拿到面试机会。那些题对我来说并不难。最终面试我的几位工程师中,其中一位是 Andrej Karpathy。

技术问题本身难不倒我。真正的问题在于,我太明确地知道自己想做什么:我想做自然语言处理,我想做 AI 写代码。而当时 OpenAI 的重心更多在强化学习 and 视觉上,我对那些方向并没有太大兴趣。

我记得他们问我,如果加入 OpenAI,我想做什么。我说,我可以做研究,也可以做工程,但我真正想做的,就是把 AI 写代码这件事做出来。

反过来说,这也意味着我未必是那个阶段的 OpenAI 最需要的人。现在回头看,我当时大概也算挺有性格。所以,收到拒信也并不奇怪。

第二家公司是 Reddit。

我当时的判断是:如果自然语言处理真的会成为未来的重要能力,那么 Reddit 这样的社区一定会变得越来越重要,因为全世界做 NLP 的公司,早晚都会需要 Reddit 这样的数据。后来事实也的确大体如此。

于是我加入了 Reddit,担任机器学习方向的高级总监。后来有朋友替我惋惜,觉得我当年如果去了 OpenAI,人生轨迹也许会完全不同。我倒没有这样想。人生不是一道能反复验算的题;很多选择,只能在当时那个版本的自己身上成立。

回头看,我错在哪里

我当然犯过不少错。

首先,我花了太多时间试图说服那些根本看不懂这件事的人。创业者需要讲故事,但不是所有人都值得你反复解释。对于一个过于超前的方向,更现实的做法往往不是说服所有人,而是尽快找到那极少数本来就能懂的人。

其次,我当时不敢 build in public。现在的创业环境已经很不一样了:公开写,公开做,公开迭代,本身就是积累势能的一部分。但那时的我没有这种心态,总想着等做得更完整、更漂亮一点再公开。结果就是,很多重要的工作做得无声息,并没有真正参与到后来那场波澜壮阔的历史中去。

最后,也是最重要的一点:我当时对自己的 failure mode 认识得还不够清楚。我没有足够清楚地知道,自己会以什么方式失败,会卡死在哪些约束上,以及当这些约束同时出现时,我应该怎样调整打法。比如我以为自己存了足够的钱,可以支撑一年的创业;但真走到关键节点时,我口袋里并没有 25 万美元让我豪赌。

回头看,我做对了什么

如果说我做对了什么,大概有两件事。

第一,我真的去做了一件疯狂的事。它没有成功,但它是真的:有代码,有模型,也有无数具体的记忆。它是我人生的一部分,而不是一个知识分子停留在脑子里的自我感动。

第二,我庆幸自己当时没有拿那笔投资人的钱。那是我拿到的第一份真正像样的投资合同,金额是 150 万美元,但合同条款我一点都不喜欢。拒绝那份合同之后,我可能得罪了半个硅谷投资圈,但我至今仍然喜欢当时那种“不愿受羁绊”的心态。我为此付出了代价,也因此保住了一点自由。

一件趣事,写给正处在 AI 浪潮中的焦虑者

最后讲一件小事。

2016 年夏天,我已经去了 Reddit,做的是推荐系统而不是语言模型,但我对 AI 写代码这个方向依然非常关注。那时候,硅谷做这件事的人彼此多少都知道一些。

有一天,两个俄罗斯年轻人找到我,想聊聊这个方向。他们一个叫 Illia Polosukhin,一个叫 Alexander Skidanov。

Illia 当时介绍自己在 Google TensorFlow 团队做技术带头人,Alexander 则是顶级 ACM ICPC 选手。我们在旧金山联合广场旁边的一家咖啡馆聊了一个下午。我跟他们讲了我做过的尝试、遇到的困难,也把自己接触过的一些投资人和这个方向可能面临的挑战都分享给了他们。我甚至很坦率地提到,有一位对这个方向很热心、但我并不喜欢的投资人;只是那个人当时已经开始转向区块链,我也不确定他是否还会投代码方向。

他们也告诉我,他们想做的事情是:用 AI 去生成 ACM 编程竞赛题目的代码解答。而且我能感觉到,他们手里或许有比我更强的方法。

分开的时候,我真心祝愿他们,也想,这两个人也许真的能做成点什么,我得继续关注一下。

一个月后,他们从那位投资人手里拿到了一笔融资,公司名叫 near.ai,意思是 AI 离我们已经很近了。

但接下来事情的发展,和我当时脑中那条线性的技术演进路径几乎完全不同。几个月后,公司转去做 AI 生成 dApp;再过几个月,又转成了做公链;最后彻底变成了一家区块链公司。

我为什么讲这个故事?

因为熟悉大语言模型历史的人大概已经知道了:Illia Polosukhin 实际上是 Transformer 论文《Attention Is All You Need》的作者之一, 当时这个划时代的论文刚刚发表, 但没人能看清楚它的意义。今天的 ChatGPT,以及整个现代大语言模型时代,几乎都建立在 Transformer 这项工作之上。

这件轶事最让我感慨的地方在于:我们这些身处其中的人,其实一直都被未来的迷雾包围着。所谓“看对了方向”或者“看错了方向”,很多时候并不足以决定你最后会走到哪里。你也许看见了未来,却没有资源;你也许拥有资源,却走向了别的方向;你也许参与了最关键的基础工作,却仍然不知道它会在几年后如何改变世界。

未来并不是线性展开的。

所以,焦虑并不能真正帮助我们接近未来。更重要的是,在你当下所能看到的边界之内,做一个对得起自己的选择;至于剩下的部分,就交给时间。


风险分配框架

Mar 23, 2022

为了操作我的大跃进基金,我自创了不少思维工具。这些思维工具经过了实践的验证后(即能够推导出正确的市场预测),我决定把它们开源出来。

风险分配 (Risk Allocation) 是我开源的第二个思维工具(第一个叫做浓雾里的第一辆车)。本文谈的 风险分配理论 以及它的直接推论 铁拳的遍历性 指导了我 2021 年度的投资哲学。

现代性风险

人类历史从来就不是线性的。一些重要的历史事件,如山关隘口,把历史分成两段叙事。工业革命就是这样的一个隘口,把人类分成了前现代和现代。

1712 年,英国人紐科門 (Thomas Newcomen) 发明并部署了大气蒸汽机,用于煤矿抽水,从此大规模的挖煤变成可能。1776 年,瓦特 (James Watt) 在修复一个发生故障的紐科門蒸汽机的过程中,提出了几项重大改进,发明了新一代蒸汽机。自此工业革命的帷幕正式拉开。机器,从蒸汽机到内燃机,从抽水机到火车飞机,影响了整个人类的生活和思考方式。特别的是,大的机器和工厂意味着大量的工人——现代城市开始兴起,城市而不是农田成为中心化的工作地点,大部分人的居住环境也变成了城市,而非靠近农田的散在建筑物。

工业革命前我们所暴露的风险大多是自然的(洪灾,火灾,旱灾)。这很好理解,比如工业革命前的农民,洪水和干旱对农作物的收成的影响构成了主要风险。工业革命后,机器不仅仅生产了商品,也生产与机器匹配的社会结构。商品和社会结构构成了现代性的风险:比如食品安全,环境污染,城市洪灾,国家动荡等等。而这些风险,都是人类通过机器和社会制度自我制造的。

贝克的《风险社会》一书,更加具体地阐述了现代性的风险,但仅仅局限于核能、气候变化等环境风险,而没有讲到政治制度等其他人类结构造成的风险。从投资的角度来说,我们还需要关心其他可以改变资产价值的风险,包括市场的波动性,监管等等,是贝克风险的一个超集。

关于现代性风险,我用归纳法做一个简单的假设:现代性带来的风险是遍历的。这很好理解:每个人都在和现代社会打交道,食品药物都是他人生产的,乘车坐船的服务都是他人提供的。享受这些现代性都意味着同时承担现代性的风险。

附带说一下,熟知“草台班子”假设的读者会立即想到从草台班子假设出发立即可以推导出风险的遍历性。是的,草台班子是一个比风险遍历性更强的假设。值得强调的是,草台班子理论推导出的风险,只是内部性风险。即便一个班子不草台,它还是可能会往外部排放风险(风险的外部性),这一点我在下一节详细阐述。

我们生活在这个社会中,不管我们愿意不愿意,每时每刻面临风险。绕了一大圈,说白了就是一句话:风险是现代性 (modernity) 的必然结果。现代社会的机器自动产生风险。所有人都无法逃避现代性的风险。这是风险的遍历性。

风险分配

风险具有遍历性不代表我们每个人所承受的风险是均等的,这里的不平等,有内生的因素——比如居住在战乱的国家和居住在中立的国家被炮火杀死的概率是不一样的,也有另外一个更重要的因素:风险的分配。

“分配”是经济学的一个核心问题。传统经济学研究资源的分配方式,由此得出市场决定资源配置的制度设计。如果我们想偷懒的话,可以假设风险是一种“负资源”(我们不想要的资源),再引入一个效用函数,即可把“风险”作为一个“负要素”纳入经济学一并处理。这种“负要素”的处理方式在数学上很精妙,我倒不以为然。我认为风险是一个真实存在的东西,而“负要素”不是。商业合同,里面清清楚楚写着的,也是风险的分配策略,而不是抽象的负要素或者效用函数。因此在这里,我把风险当成一个“一等公民”来处理,谈谈风险的分配。

我所谓的风险的分配,是指风险被现代性生产出来之后,最终如何落实到每个人身上,以及在这个过程中哪些人用了什么方法避免了这种风险。 我认为,考察一个社会的制度(这里的制度是制度经济学里的制度,即 Institution),一个很好的入手点就是风险是如何通过各种机制进行分配的。

下面我就提供一些具体的从风险分配的角度看各种制度的例子。

风险分配的法律机制

当徐州的光棍找不到老婆却又想传宗接代时,一个巨大的风险就被生产出来。一个年轻的女孩在放学的路上突然吃了一闷棍,在那一刻,徐州的光棍制造出来的风险,就变成了铁链,分配到了这个女孩头上。在公平正义的理想社会里,这个光棍生产出来的风险,最终会被公正的法律再度分配回去,变成他的刑事犯罪和民事赔偿。这就是风险分配。Taleb 所著 Skin in the Game, 全书讲的就是一个简单的风险分配的原则:制造风险的人请对等承担风险。

以上所举例子里的刑法制度,可以看成是风险分配在法律层面的体现,或者说一个社会是如何规约 (normative) 风险分配的。

在美国,Tort 侵权法制度提供了另一个对抗“负外部性”型风险的法律维度。1998 年,美国46个州和全美最大四家烟草制造商达成美国历史上最大规模的侵权诉讼和解 (The Master Settlement)。烟草公司售卖的卷烟导致肺癌等疾病,间接增加了美国各州在居民医疗保险上的开销。烟草公司将风险分配给吸烟者,吸烟者将肺癌风险转化为财政风险分配给各州医疗保险基金。各州通过侵权起诉,成功将此风险转了一圈还给了烟草公司。烟草公司也由此不再投放面向青少年的烟草广告。前面我们提到了草台班子,这里烟草公司无论是不是草台班子,都会制造风险,所以风险不是消灭草台就能解决的。

在商业合同法里,商业合同既可以看作收益分配协议,也可以看作是风险分配协议。在我看来看成风险分配更加接近本质,比如不可抗力 (Force majeure) 或 Act of God 条款,无法解读为收益分配协议,但很简单可以理解为小概率事件下的风险分配策略。

风险分配和经济学解释

和其他任何商品一样,风险也是可以在自由市场上交易的,一个最简单的例子就是保险:通过购买保险,我们对冲了自己的风险。亚当斯密指出,劳动分工和市场交换促成了经济增长(即一阶导数平均为正值),我们这里可以补一个亚当斯密第二定理:风险分工和市场交换促成了经济的稳定增长,降低了市场波动率(二阶导数近乎于零)。

所谓的“风险分工”,是指每个市场主体对各种风险的承受能力不一样。最优的分工是把风险分配给最能承受/应付风险的人,好比把炸弹留给拆弹专家。风险可以被自由交换意味着有效的市场和发达的保险(以及金融衍生品)产业。试想如果这个世界没有保险市场,则风险随机砸到谁的头上,谁的生命或财富就随机归零。在这样的世界里,因为没有保险作为随机产生的风险的阻尼,环环相扣的劳动分工市场成了风险的正反馈放大器,一个很小的风险扰动都能够带来巨大的市场波动性。

在经济学里,我们常常讲“外部性”。比如,工厂生产时向空气中排放污染物,就是工厂生产的负外部性。实际上排放和生产是一个硬币的两面,内部外部是我们人类自己制造的概念。看用“风险分配”的角度来诠释更加接近问题的本质:如果说污染物能够导致癌症,那么工厂就是将癌症的风险生产出来并分配给了保留于这些污染物的人。当然工厂也可以通过投资处理装置将这个风险转化为成本转嫁给自己,改变风险的分配,那就没有了所谓的外部性。

科斯定理讲,在这类外部性情形下,只要产权明确,交易成本为零,无论初始产权设置如何,当事人可以通过交易,处理外部性,达到帕累托最优。这个定理可以推广到风险分配上:只要风险交易成本为零,边界清晰,则无论风险是怎么生产出来的,最终一定能够通过交换达到帕累托最优。

将风险分配纳入新制度经济学框架,不是卖弄学术工具,而是因为有了交易成本这个工具,我们可以自然地推导出铁拳的遍历性和带来的市场波动性。许多人在 2021 年没有看到这一点,从而低估了中概股的波动性。 鉴于这已经是过去时,下面这段也不再是秘密了。

交易成本和铁拳的遍历性

什么是铁拳我就不再赘述了。能把在线教育这样的行业一夜归零的那个东西,就叫铁拳。如果非要扯个定义,我把它定义为无法申诉的风险分配。 风险分配给你但你无法申诉,那就是铁拳。所谓的铁拳的遍历性,我的定义很粗暴:不管什么人,什么实体,不管从事的什么行业,有什么样的地位,给予足够长的时间,一定会被铁拳打击。 表现形式可能是资产缩水或者其他更严重的人身后果。按前文所说铁拳的定义,这样的损失是无法申诉或对冲的。

这个是个非常强的论断,强到我最初不敢相信。我一度反思是不是这个论断的情绪的成分远大于实际价值。毕竟,看到粉红被遍历的铁拳捶打不免有种幸灾乐祸感。后来当我建立了整个风险分配和交易成本的理论框架后,我终于说服了自己。

我的论证过程起源于一个思想实验:有没有可能成立一家保险公司,向可能被铁拳伤害的人提供保险并且盈利? 如果有这样的“铁拳险”存在,则铁拳的遍历性就不存在了,因为“铁拳险”的投保人按照定义不会被铁拳砸伤。

这个思想实验一构造,证明就简单无比了:如果交易成本为零,则这样的险种不可能在铁拳管辖的范围内存在,因为它会造成一个逻辑悖论。铁拳可以和这个保险共谋,随机砸一个投保的单位。这个单位因为买了保险,不受损失;而在这个思想实验中,该保险公司在这个险种上是盈利的,所以,铁拳砸下去,社会总财富还增加了。这样,只要铁拳无限砸,财富就无穷无尽生产出来,显然这是不可能的。所以,在交易成本为零的假设下,“铁拳险”不存在,或者说,购买铁拳险的交易成本应当要非常大,大到不能对冲投保者的总损失(具体证明很简单,这里从略)。换句话说,企业和个人无法运用科斯定理,降低自己在铁拳下损失(即波动性)。就这么简单,我们已经证明了铁拳的遍历性。所有和铁拳没有利益瓜葛的产业,都无法对冲铁拳风险。

等等,如果在这个思想实验中,这个保险公司只负责收保费而不负责对外赔偿的话,再和铁拳共谋,这家保险公司岂不是可能获得暴利?是的,这家保险公司的名字叫做 SOE (State-owned Enterprise). 显然,再说下去这个思想实验已经危险了,我暂收一笔。

回到投资这里,2021年初我证明了铁拳的遍历性后,就一直认定一个结论:整个金融市场严重低估了中概股的波动性了。当然,这个结论现在看来很显然了。即便如此,我认为还有被低估的波动性存在,然而我说的已经够多了。

致谢

在思考风险和铁拳这个问题的时候,我从素未谋面的推友 雨夜漫步大祭司 @renfanzi 那里获得了许多有益的思想和启发,特此感谢。

一个多年好友带我走进了法律的世界,自此世界观多了一个维度,谢谢!


财务自由后做些什么

Nov 1, 2021

彼岸问题

There are two great tragedies in life. One is not to get your heart’s desire. The other is to get it. — George Bernard Shaw

横亘人类历史,绝大多数人的一生都是与恐惧、病痛、饥饿等形影不离的。现实世界是如此的苦,以致于传统宗教无一例外,都描绘了另一个没有恐惧,病痛和饥饿的世界,作为这个世界的他者和彼岸。

在传统的图景里,我们生活在此岸的最终目的,是为了到达另一个世界。如何在这个世界的生存以及获得意义的哲学问题是如此的重要, 以致于我们所熟悉的所有的生活哲学和智慧,都是关于此岸的,或者如何到达彼岸的。这种哲学侧重,也就天然忽略了到达另一个世界后如何生活的问题。如何在彼岸幸福地生活是一个古典上无意义的问题,也从未被前人解答过。

技术进步和自由市场给予了这个时代前所未有机遇,制造了前所未有的财富。在这个大背景下,许多人也藉此获得了财富和财务自由。

财务自由可以算是我们这个时代的一个彼岸世界。在这个世界里,我们享受的富足和自由,无需再奔波劳苦。可以说,我们这个时代的财富所有者,生活在前人梦想的世界,是他们眼里彼岸世界的现代具象。

明明传统智慧指向的彼岸已到,日常生活却还要在此岸世界继续。无数的书籍和布道者在”如何到达财务自由”这个问题上连篇累牍,而在到达后又如何面对生活鲜著笔墨。传统智慧隔靴搔痒,现代自我帮助类书籍也仅寥寥数笔。我想,财务自由后做些什么是一个有意义的问题,也可能是许多读到这篇文章的人迟早要思考的问题。

我觉得一个人到达财务自由后,应该做三件事情。三位一体,方可构成一个完整的人生叙事。显然,我的思考是个体的,阶段性的。

第一件事情是 和解(Reconciliation)

财务自由意味着资产账户的充足余额,这是看得见的余额。在看不到的心理账户上,我们往往余额不足,或者背负着债务或利息。背负债务是不自由的。所谓的心理和解,就是重新定义和自己的关系。通过重新定义和自己的关系,我们偿还或放下人生债务。

人生奔跑,难免错误和不完美。我们可能放弃了一些重要的东西,时过境迁再也找不回来;我们可能犯了一些重要的错误,错过了一些重要的人,亏欠了世界许多。犯了错误的,余生可以选择活在后悔和失望里;想重返过去的,余生可以活在无尽的寻求替代品的循环中。和这些过去充分和解,意味着不再背负这些过去的阴影。人生负重太多,再多的财富也无法平和。和错误与不完美和解,是和真实的自己做知心朋友,而非生活在理想的自己的投影里。

财富得来的路径多种多样,没有通项公式。在财富面前心态平和,就要和到达财富的路径依赖和解。人就是很奇怪,有时候不光比钱,还比钱的来源:老钱看不起新钱,公司上市的看不上炒币致富的,达到小目标的羡慕大目标的,割了韭菜心慌慌羡慕白手起家的。

这些年也见到不少那些觉得自己有能力从另一条路走向财务自由的,宁愿放弃现有的一切,去证明自己的财务不是来于运气等等。有人对现有的财富仍然不满意,想要用已有财富博取拥有更多的财富。有人对自己到达财富的方式不满意,想要用另一种方式到达财富。凡此种种,都是欠缺和财富的路径依赖和解。

财务自由后,另一个常见的认知失调是人生的价值定位。作为身外之物的财富,并不能自动解决未满足的人生欲望,从而造成财富和人生价值间的落差或者认知失调。在硅谷,许多拥有巨额财富的创始人和投资人,各方面看上去很成功,却处理不好自己的欲望。他们的人生价值,在成功人士和性丑闻之间简谐振荡。

在推特上,会傅里叶变换的理工博士一方面抱怨找不到朋友,另一方面言语骚扰陌生女性。他们没有和自己的欲望以及人生的价值和解,以至于让这两种力,将人生硬生生拉扯成提线木偶剧。财富和知识没有带来自由,只是带来了更多的心理失调。

时时定义和自己,和世界的关系,本是成年人周期性要做的基础性工作。财富的跃迁让这项工作显得更有价值——不和这些事情和解的话,彼岸和此岸又有什么区别呢?另外,不和财富的路径依赖和解的话,似乎彼岸比此岸还多了一项烦恼:钱。人生本来就苦,何必再叠床架屋。

第二件事情是 主动给人生赋予意义(Assigning meanings to life)

在此岸世界里,我们常常以目标赋予事情意义。念佛为了往生西方极乐世界,跟随主耶稣因为它的救赎等等。获得财富之前我们所做的,是为了财富。获得财富之后呢?好比一个小孩从小被灌输好好学习拼命做题是为了上大学找到好工作,那找到好工作之后呢? 如萧伯纳所说,人生的两个悲剧,一是得不到想要的,另一个是得到了想要的。

财务自由后,如果依旧以目标为手段赋予人生意义,人生顿时会变得毫无意义。理想里,我们终于可以做自己想做的事情;现实里,你缺少足够的约束去做任何事情:任何世俗的事情都是可以做,也可以不做的。如果一件事情不再是必须要做的,我们会心生厌倦,会百无聊赖。

此时,一个有用的方法是主动赋予人生选择内在的意义。这个意义是行动本身的,没有具体目标的,通常是无法用语言表达的,不足为外人道的。我也无法用语言讲清楚,只举例说。

比如,“和孩子在一起玩”这件事情,它是一个行为,本身没什么意义。我们可以主动给予这件事情意义——这件事情的全部意义,就是”和孩子一起玩”。这听上去像绕口令,但许多事情的意义就在做这个事情本身。如果我们非从以另外的一个目标里推导出这个事情的意义,做这个事情本生就失去了意义。

比如,如果我们和孩子一起玩是为了让孩子更加爱我,或者未来他如何如何,那么财富就偷偷跑过来捣蛋,对着我们的耳朵说:你为什么要花时间和孩子们玩一个下午呢?又累又吵。为了实现以上目标,你可以花钱买昂贵的玩具,或者请个很贵的家教啊。这些手段不是比和孩子一起玩省心省力嘛?这个例子看上去很假很戏剧化,却是我见过多次的真实情景。财富堆积等身,此时却成了人生重要意义的廉价替代品。

当一件事情本身自带的意义(其实是我们赋予它的)不大不小,正好涵盖这个事情的时候;当我们的人生的意义不大不小,正好涵盖我们的人生的时候,财富就不会成为补全那些缺失意义的廉价替代品。

我常常想起海子的诗和他追求的面朝大海,春暖花开。如果我们不主动赋予生活意义的话,喂马劈柴何必要自己来做呢,关心粮食和蔬菜又有什么幸福可言?这些“琐碎”的事情能不能够带来心的平静,完全在于我们赋予的它们的意义。

身处消费主义盛行的时代,消费成了一种符号和意义的幻像。我见过一些穷的只剩下钱的人,如抓稻草一般抓住一些给他们的人生带来价值的消费品。他们在不高兴时随手买辆法拉利,却找不到一个靠谱的人倾诉。消费真的给他们带来有意义的人生了么?

第三是 回馈这个世界(Giving back to the world)

大乘佛法讲自度度他。惭愧的是,尽管我知道这一点很重要,这一点我才刚刚开始做,并无太多心得体会。算是先放个占位符,容以后再展开吧。

目前我唯一肯定的是, Andrew Carnegie 说的是对的,拥有巨富死去是一种耻辱。一个人应当在精力衰退之前就开始对世界的回馈。用死去后留下的财富对世界回馈,更像是表达一种带不走财富的遗憾。一个人有选择地,积极地回馈这个世界,让这个世界更加公平正义,让后来人有更多的机会能够获取财富,应该算是对财富和这个世界的一种基本礼仪。


愿你我的人生超越富足,富有意义!


我的量化哲学和策略

Feb 4, 2020

Comments

缘起

博客的老读者一看标题就会说,这是一篇和我博客文章风格迥异的文章。这篇的确是我所作。这是两年多的思考积累,写出来和大家分享。为了把我的思考轨迹讲清楚,先说一下我这几年的成长轨迹作为文章的起缘。

上次写文章还是 2017 年从事 AI 方向创业的时候写的——一晃三年了。上次的创业公司不算很成功,最后把 IP (知识产权) 卖给了一家公司。之后我在 Reddit 担任了两年的机器学习工程总监 (Director of Engineering)。从头建立了 Reddit 的机器学习研发团队,把 Reddit 的整个 Feed 系统算法化,个人化。帮公司在用户平均在线时间,广告投放点击率上实现了大于 50% 的质的飞跃。

这几年在人工智能领域的工作和创业,使我对整个深度学习的方向有了深刻的认识。我认为, GPU 上运行的深度学习框架是一个通用的计算平台,作用不仅限于机器学习。于是,业余时间,我开始尝试用 TensorFlow 这样的深度学习框架去解决一些非机器学习领域的问题。其中的一个领域,就是量化金融。

另一方面,三年里,我在职业和家庭人生这些方面都感到很满足很幸福。我有一个美好的家庭和一对健康成长的儿女。然而,这几年中,熟悉的朋友一个接一个肉身翻墙,国内发生的烦心事情越来越多。我还有父母和兄弟在国内,有时候不想关心国内信息也不可能。有天我在推特上说,“山河破碎,豺狼当道;麦秀粟离,沉郁悲呛”。一方面幸福平和,一方面沉郁悲呛,这样的心境于人于己都不健康。

某天我突然想到古人的 “国家不幸诗家幸,赋到沧桑句便工”,突然想通了。当年遗山老人没有高级金融工具,只能悲愤而做岐阳三首,成为一代诗家。如今我们所在的时代给予了我们许多表达和应对“沉郁悲呛”的方法。我的策略是用当今的数学物理和金融工具,以求“量化沧桑尽微力”。这样微弱的改变,总比躲进小楼成一统好一些。是为缘起。

大变局时代

这是一个大变局的时代。技术本身更快地创造和摧毁资本价值。熊彼得提出的创造性破坏每天都在加速。 30 年前,S&P 500 公司在榜单里待的时间平均是 33 年(出入榜很好地反映了价值和财富的创造和破坏),如今已经减少到 24 年,到 2027 年预测会继续减少到 12 年。 这方面例子比比皆是。如 Charles Schwab ,30 年前首先开创低价股票交易模式,破坏了当时的高价股票交易代理商,如今面对 Robinhood 这种免费交易对手的创造性破坏,也被迫推出免费股票交易。当年的创造性破坏者如今被新一代的公司创造性破坏。

我相信技术是经济增长的内生动力。技术的进步是非连续的,这意味着对财富的创造和破坏也是非连续的。刚刚过世的哈佛管理学教授 Clayton Christensen「创新者困境」 里描述了这种非连续性:行业领先的公司似乎忽然之间就被小公司超越。上面我们说到 S&P 500 榜单公司的平均寿命越来越短,其实是技术的破坏创造力越来越大的体验。

大变局也意味着大泡沫,一些公司看上去代表了新经济新技术,实际上内里全是泡沫,只是故事讲得好。所幸的是,物理学已经给我们指点了一套识别泡沫的方法。

大变局时代的物理金融方法

几十年前,我们还可以把技术当成外部变量来处理量化模型。随着技术对财富的加速创造和破坏,我们很难将技术排除在模型之外还能准确地计算资产价格。把技术纳入财富的创造和破坏模型,即抛弃传统的微观和宏观经济学的框架,拥抱复杂系统科学(物理学),拥抱非遍历经济学,拥抱内生经济模型。

用复杂系统(相变)的眼光来看金融市场——随着整个市场的自动化程度越来越高,相变也越来越频繁。这样频繁的相变意味着两点:

  • 第一,我们需要用复杂系统的数学物理方法来量化金融市场,而不是传统的随机游走理论。如「黑天鹅」的作者 Nassim Nicholas Taleb,一直在强调不要用随机游走的方法来量化市场。

  • 第二,传统的价值投资(以巴菲特为代表)可投资的领域在变小。巴菲特的投资哲学着力寻找那些高质量,未来一二十年有稳定增长的公司。但随着破坏性创造越来越频繁,这些股票越来越难找。事实也是如此,Berkshire Hathaway 如今手握大笔现金(总计 1280 亿美元),近四年来都没有出手任何大的投资标的,而是回购自己的股票支撑价值。

总的来说,新的内生经济增长方式决定了判断金融资产价值的方式要超越简单的未来现金流折现,因为未来现金流折现蕴含着连续性假设,而如今的未来是一个不连续的方程,尤其是在技术变革,动力转换和泡沫成长破碎的时候。这些非连续的事件正是可以让收益超过市场平均的机遇。

模型的业绩

通过去年一年的实际操作,结合上面说的物理方法,我认为我找到了一套行之有效的量化哲学和策略。我把这个方法很粗暴地命名为 “大跃进” / Great LEAPS。我自己管理的对冲基金也就暂且叫做大跃进基金。 命名后面的逻辑后面我再解释。

在阐述具体方法之前我讲一下我去年的成果。去年一年我总资产的年化收益约为 45%。 今年第一个月收益接近 14%。 所有收益均采用量化模型,而非基本面分析,技术分析等等。交易则由我手动执行。因为不是高频交易,手动执行和自动执行差别不大。

去年我最大部分收益来自于做空 NIO (蔚来汽车)。模型从它的股价大跃进里发现泡沫。我于 2019 年 1 月 19 日购买 N 手 2019 年 8 月 16 日到期的 PUT 期权,行权价格为 $14,购买价格为 $7.80/share。 至 2019 年 8 月 16 日,NIO 股价跌至 $2.96, 我以 $11.04/share 卖出,收益率为 146%。 其他操作收益不等,不占主要。

今年(2020年)第一个月我最大的收益来自 LK (瑞幸咖啡)。同样使用量化模型找到泡沫。我于 2020 年 1 月 10 日购买 N 手 2021 年 1 月 15 日到期的 PUT 期权,行权价格为 $35.00。购买价格为 $9.00。至今 LK 股价已跌落至 $31.36,而该期权价格升至 $13.40,如果今日卖出收益率为 148%。事实上,我基于基本面判断 LK 的真实股价为 $0。但这和模型无关,我在等待模型给出的另一个下跌窗口出手。

以上两例,尽管都和中概有关,但模型本身没有特别的给中概股权重。做空泡沫需要一定的勇气和耐心。比如做空蔚来的时候,著名做空机构香橼发布了一份做多的报告,我的总基金纸面上的损失达到了60%。但模型的威力是明显的,蔚来之后股价一路下跌。

随着中国经济的失速,这样的机会还有很多。在中国,增速的技术遇到了制度和人口结构变化,呈现出了独特的破坏式创造的风格。许多人主张做空中国(人民币,ETF,或者一些夕阳产业)。我的信念是这种笼统做空方式收益风险比过低。做空中国本身已经是一个有效市场,况且体制本身的行为很难在量化模型中刻画出来。

用深度学习的牛刀来屠量化金融的龙

上面我提到,大变局伴随的是物理的相变过程。然而,从短期趋势来说,发生的时间不可预测,也不可计算。这几天,许多做空 Tesla 的人都被其股价上扬震惊了。事实上,短期市场永远是一个难以预测的怪兽。短期要切准时间太难了。

然而,从中长期来看,我们有较好的预测相变的办法。比如, LPPLS 模型可以预测泡沫的破碎。然而,现有的模型优化手段非常粗糙(遗传算法),很难稳定收敛到一个可信的值。在这方面,华尔街和物理学家还没能普及更好的模型优化算法。其实更好的模型优化算法已经出现,即现有的深度学习框架。这里,并不是要用深度学习/神经网络本身来做量化金融,而是用深度学习领域的技术工具。这是一个非常独特的机遇,因为:

一方面传统的华尔街/量化公司已有一套完善的量化工具,但这些工具的模型表达和优化能力远不及 TensorFlow。另一方面,懂得 TensorFlow 这些工具的人目前都忙于做人工智能,还很少有人来捕捉量化金融的机会。TensorFlow 框架在量化金融上可以做许多事情。我觉得以后量化金融会逐步转移到这种全面的计算框架上来。我不怕写出来和大家分享这个“秘密”,因为目前能够把两者都玩转起来的能太少,我宁愿这样的人多一些才好。 同时,我认为未来几年,这个“秘密”武器有一定的先发优势,可以在一些模型上比它人获得更加好的结果和汇报。

对我来说,TensorFlow 和 GPU 可以用来预测和捕捉复杂系统的相变时刻。这样的预测必然是一种近似,而非科学预测。所以,问题是,有了相变(比如泡沫大概什么时候破碎)的信息,如何从金融市场中套利?知道信息本身只是10%的工作,用正确的工具来套利是 90% 的工作。

通过这一年的实践我找到了一个适合的金融工具,这个工具的名字叫 LEAPS,即长期期权。而在实践中,这是一个它山之石,长权短用,寻求高额回报。

LEAPS 工具

LEAPS 是一种特殊的期权,这种期权的过期日期往往在一年开外。因为美式期权的特点,意味着你有很长的时间来等待收益。当然,世界上没有便宜的午餐,长时间意味着更高的期权价格,也意味着小的 Theta 值。

做空并不是一件复杂的事情。然而,价格下行或许能立即发生,或许还要等几个月,或许半年内都不会发生。这正是许多做短期看空期权的人需要冒的风险,也是许多人倾家荡产的原因。在我看来,用短期期权去赌股价的上下,除非有额外的信息,否则真的是赌博。

在随机游走的假设下,LEAPS 本身也是公平的赌博。然而,当 LEAPS 和物理金融方法以及 TensorFlow 模型结合在一起,LEAPS 就有了一个新的维度: 用随机游走的量化模型计算出的期权价格 (现有的 LEAPS 定价策略),与用物理方法计算出的模型相比,在相变前期,后者能更加准确地刻画相变,更加符合金融市场的实际情况。方法本身没有好坏,差别在假设上。我相信,能够导出股价变化遵循 Power Law 分布的物理量化模型,比不能够导出 Power Law 的模型更加准确地捕捉相变。

一般专业交易者把 LEAPS 当成长期风险对冲工具。我的用法可以算是“直板横打”。我将 LEAPS 当成低风险的短期收益工具。以看空期权为例,在股价不变前提下,通过不断计算 LEAPS 的剩余价值,我可以控制时间流逝带来的折损。如果泡沫不破碎,则在其时间价值迅速贬值之前出售。如果等到泡沫破碎,则出售换取超额收益。当然,如果股价上涨,看空期权必然下跌,所幸的是,因为没有要紧的时间压力,你有选择等待的空间。

在这种策略下,收益不是从每日交易中得到,而是在等待中出现。这里的秘密是: Theta 函数随时间的变化是非线性的。在股价不变的前提下,LEAPS 前期的贬值极低,刨去市场无风险收益率,在前六个月几乎可以算是免费持有。

这里细节上还有一些有意思的东西,比如,依赖于 Hamiltonian Monte Carlo 方法,我们可以用 MCMC 和一套新的假设给 LEAPS 期权定价。一些原本不能做到的套利行为也可以在 TensorFlow + GPU 的帮助下完成。

结语

说到这里,我把这套对冲策略和基金命名为 Great LEAPS/大跃进 也就明白了。我的策略就是用量化的方法寻找那些看上去好像股价大跃进,其实内里土法炼钢的股票。找到后,用 LEAPS 策略套利。这套工具链和逻辑链能够成立,依赖于时代的机遇和泡沫,依赖于众多物理学家,数学家和机器学习工程师所构建的基础。

限于篇幅许多理论和实践没有一一展开。我一直相信,如果勤于思考的话,钱会来敲门。基于此,我宁愿写出来和人分享我的思考,希望更多的人知道模型和量化的力量。


AI 创业的一点思考

Jan 4, 2017

Comments

2016 年 8 月,我从 Fitbit 离职创业,做一个用 AI 帮助程序员更好的写代码的公司。在过去的四个月里,通过无数的模型,产品和数据的迭代,加之和用户交谈,以及观察其他的创业者,我积累了一些想法,写下来抛砖引玉。

此 AI, 是名 AI, 非 AI.

这一波的 “AI” 创业热潮,准确的说应该是“深度学习算法”创业潮。人工智能本身是一个涵盖极大的领域,除了学习和表示(深度学习的主要领域)之外,还有推理,规划等等其他大量分支。普通人理解的人工智能,大多数都是“强人工智能”的范畴(一个可以完全代替人的智慧的机器)。而大量的创业公司都纷纷采用 .ai 做为域名后缀,实质上只是在“深度学习”这个子领域,解决一些特定的,以前只能靠人的智慧才能解决的问题。

就和 .com 时代一样,域名后缀的符号意义远大于实际意义。媒体,投资人和创业者都默默接受了 .ai 这个集体幻觉。总的来说,目前 AI 公司的井喷,是深度学习这项技术完成其技术扩散 (diffusion of innovations) 的体现。在 Google, Facebook 等技术领先企业的示范和大笔收购下,风险投资大量向 AI 倾斜。许多掌握机器学习和深度学习的人才,认识到深度学习可以用来解决一个具体的问题,也流动到创业公司开始创业。因为 AI 入门门槛很高,目前还是很容易从创业者的教育和工作经历来甄选到底一个公司做的是不是深度学习,还是挂羊头卖狗肉的。

深度学习的确“创造”了许多创业公司可以挑战的新问题

有许多了解和从事机器学习的人,并不觉得这一波的“深度学习”技术有多神奇。这是可以理解的,因为深度学习的主要技术 30 年前都齐备了,只是最近被某种魔法召唤出来。在我看,这一波的 AI 创业潮,不是泡沫,是对多年没有在工业界铺开的机器学习技术的复仇。过去的十多年中,我们经历了互联网时代,社交网络时代和移动时代。有了众多的站点,社交网络和应用。机器学习和云计算解决了许多问题,如搜索引擎,大数据处理,但仍有许多问题,如图像,视频,语音,自然语言的处理,都是传统的机器学习方法没有能很好解决的。深度学习的出现,使得解决这些问题成为了可能。

解决问题的工具进化后,以前大家没觉得是问题的(主要是解决不了),现在变成了问题。一个最简单的例子是自动驾驶。我在 Google 自动驾驶部门工作的时候,视觉系统还是用的传统的物体识别方法,有许多规则和边界情况要额外处理。汽车一方面需要额外引入其他传感器的数据做判断,另一方面需要不断分解自动驾驶问题为行人识别,自行车识别,信号识别等子问题。所有的子问题加起来,工程复杂度太高,创业公司是很难组建出一个能解决这个问题的团队的,而且所谓的“解决”,也不能达到商用的地步。拜深度学习所赐,如今从视觉信号,模仿人类驾驶行为,就可以做到高质量的巡航控制。这时候,自动驾驶问题就变成了一个创业公司可以挑战的问题。2016 年这个领域新闻一个接一个。Cruise 今年被 GM 收购,Comma.ai 获得了 A16Z 的投资等等,都是自动驾驶领域创业公司成功的例子。在许多的细分行业,这样被深度学习“创造”的新问题不胜枚举。然而,

想要成功,单解决一两个问题是不够的

深度学习是一项技术。这个黑科技可以作出更加准确的机器学习模型,但更好的模型仍然要通过产品落地。特别是创业公司,在没有相关平台支撑的条件下,解决一两个问题很难给用户带来实际价值。在技术史上,没有一家技术公司是依靠一个领先的机器学习模型就成功的。即便 Google 这个以 PageRank 为核心算法起家的技术公司,也是通过将技术包装成一个优秀的搜索引擎而落地的 (当年的 Yahoo! 甚至还看不上这个技术)。

这里面的原因,可以分成 To B 和 To C 两个方向来说。

目前深度学习所解决的问题,大部分都在图像,人脸,视频,文本等领域——因为深度模型大部分都是为解决这些问题而设计的。靠一两个深度学习专家,创业公司完全有实力去挑战如图像分类,语音识别等通用问题。然而,解决通用问题的门槛只有一个:只要跳过了这个门槛,前方就很难再建护城河了。对用户有价值的通用问题,特别是 To B 的通用问题,一定是对巨头有价值的。2016 年,Google 和 Microsoft 都发布了图像,语音识别等通用 API。一个明确的趋势是,云服务商正在把这些基于 AI 的服务做成平台的一部分。在同样的图像分类服务面前,巨头的服务一定比创业公司要廉价。如果没有巨大的先发优势。创业公司在这个方向很难抵抗云服务巨头的侵蚀。此外,把针对通用问题的机器学习模型,浅包装成一个 API,的确容易切入市场,但也容易被巨头和其他创业公司碾压。现在市场上有许多浅包装深度模型的公司,提供如“鉴定黄色图片”等服务。在我看来这些服务的可替代性太强,大家技术差别也不大,最终能胜出的,只会是一两家有先天优势的公司(比如云服务巨头,或者第一个进入市场的公司)。To B 的 AI 创业公司的挑战不在技术上,而在产品创新上。怎么制造差异化服务,让这个服务无可替代——这就看各家公司的想象力了。

在 To C 方向,2016 年许多创业公司都做了很多尝试。今年很火的 Prisma, 就是将风格迁徙神经网络运用到用户照片上,将照片转换成各种艺术家风格。Prisma 可以算是提供了一个杀手级的特性了。即便这样,创业公司想靠一个特性和巨头竞争也是不可能的。Prisma 不可能靠这一个特性取代 Instagram,即使 Instagram 没有这些人工智能的滤镜。原因很简单,IG 控制了移动时代的大量的用户群,因此 Prisma 制作的照片最终还要通过 Instagram 才能传播出去。To C 方向的先发优势是不可估量的:一旦用户形成使用习惯和网络效应,再好的 AI 产品也很难转化现有用户。其实这个问题困扰所有的公司。比如 Google 今年连续在 Gmail, Google Docs 里做了许多 AI 创新,还发布了 Allo 这个全新聊天工具。可是,大量用户依然用着 Office 和 Facebook Messenger。

说了这么多,好像很悲观。To B 和 To C 都困难重重的样子。其实机会还是非常多的,只是没有“AI = 创业机会”这样一个自动成立的等式而已。

AI 创业公司的优势

先说什么不是优势,或者护城河。其一,如果创业是凭借着一个“独特的算法或模型”,这个切入点是靠不住的。AI 创业已经过了 2014-2015 巨头为了收人而收购公司的阶段。目前投入到创业浪潮中的,都不大可能是当时巨头收漏了的。在这种大环境下,没有任何一项技术是别人不知道的,或者非常领先所有竞争对手的。目前宣称有独特模型和算法的,是把赌注押在一个特定的方法上,而和全世界的所有研究者竞争。目前来说这注定是无效的——谁也不知道明天 DeepMind 会公开什么黑科技,一下子超越了你的独特模型。或许在这个赛道上再走几年,有些公司的确能够领先其他。目前大家都在同样的起跑线上,模型或者算法的领先可以忽略不计。

其他,“把标准问题做到极致”既不是护城河,也不是竞争优势。如果回到 2012-2014 年,哪个创业公司能够用深度学习在 ImageNet 上刷出第一,肯定是立即像 DNNResearch 那样被巨头揽走。其中一个原因,是用深度学习的人太少了。现如今,世界上攻克标准问题的团队,百分之百都是用深度模型。当全世界的学术团队都来刷榜的时候,创业公司耗散精力去刷榜是不经济的。而且,刷榜要求的,许多时候是特定的工程技巧,未必能用到产品中。一个典型的例子是当年 Netflix 竞赛的第一名,它们的模型过于复杂,没法产品化,Netflix 最终也没有采用

在我看来,AI 创业,还是要落实在深入解决一个非标准(不能拿标准的深度学习模型一套就能用)的问题上。只有在非标准的问题上,切实的了解用户需求才变成可能。标准的问题,如图像识别,自动驾驶,可以说,最终产品的亮点大家都差不多,因此人工智能也就不自动成为一个亮点。在非标准的问题上深耕,无形中就构建了两个护城河:1,竞争对手需要花时间了解这个问题之后才能提出解决方案和产品;2,你比竞争对手先收集许多解决这个领域特定问题的数据,因此在同一时间节点上,你的模型永远领先对手几个月。这就像微软的搜索引擎或许使用的模型很先进,但因为没有足够的数据因此质量永远落后 Google 几个月一样。

最后的话

解决非标准的问题,需要的就不仅仅是 AI 人才。对特定行业的了解,痛点的把握,对用户的理解等等,往往比 AI 更加重要。在这一点上,AI 创业者可能会死磕模型和数据,或者只想着找最顶尖的 AI 研究者,而忘记了真正对用户有价值的东西。模型只是整个产品世界里很小的一部分。AI 创业公司不代表 AI 是唯一重要的事情,这一点算是我前面四个月学到的一点经验。