Manus联创季逸超做客张小珺访谈 文字版 (一)
注:本文字版转录自 季逸超做客张小珺的播客节目,内容过长预计分3-5期放出。
Hello,大家好,欢迎收听张小珺商业访谈录,我是小珺。这是一档由语言及世
界工作室出品的深度访谈节目,我们希望和你一起从这里探索新世界。
今天这期节目很特殊,我们的录制时间是2025年的12月1日,嘉宾是Manus的联
合创始人和首席科学家季逸超(Peak)。就在刚过去的凌晨,Meta宣布全资收
购Manus,而在这期节目录制的彼时,也就是月初,收购事件尚未发生。最终,
这期节目成为了Manus最后的访谈。
主持人:Hello Peak,先给大家打个招呼,并且做一个简单的自我介绍。
好,大家好,我叫季逸超,朋友叫我peak,我是Manus AI的co-founder and
chief scientist。然后今天很荣幸能参与这个节目的录制。
主持人:你从小的经历感觉就很与众不同,就是很小,四岁就去了美国,然后二
年级又回国,高中开始创业,大学辍学了,又创业,然后又读完了研究生。你讲
讲你的这段经历吧。
首先得从我家庭背景讲起。我觉得我很幸运,我的父亲是北大物理系教授,就是
传统意义上的科学家;然后我母亲算是老一辈中关村连续创业者,当然现在可能
可以叫企业家吧。对,所以我从小在两种不同的风格中一块去成长,我可能就在
两者中取了一个中间点,就是所谓的科技创业者。然后我从小的话,其实不是那
种聪明孩子,就学习也就一般,但是呢,就是比较喜欢自己瞎琢磨。
就偏科吧。对,就是其实我不知道我学习到底好不好,或者聪明不聪明,因为我
觉得我就没怎么学。对,然后我比较幸运的是,我很早就找到自己喜欢做的事儿
,那时候大概是2009年,就是苹果出了iPhone之后的第二年。对,那时候对我
来说有一个很大的改变,就是App Store出现了。App Store我觉得对我来说是特
别重要的一个转折点。
因为在App Store之前,其实世界上很多人像我一样就喜欢自己捣鼓软件或做东
西,但是你其实缺乏一个很好的全球化变现的能力。但这时候对于一个高中生来
说,如果你只是在瞎捣鼓一些课外的东西的话,这个东西其实是比较离经叛道的
,你知道吧?就是你没有一个很好的第三方指标来证明说我的这个爱好其实是有
价值的。而App Store当时的出现给了我一个契机,就是说我可以向我的父母、
同学、乃至于老师证明说我瞎搞的这个东西是能产生经济价值的。
所以呢,我就算是中国第一代软件出海的创业者。对,当时那时候还在上高中,
然后我是做了一个第三方的iOS浏览器,叫做Mammoth Browser(猛犸浏览器
),当年也稍稍火过一点吧。用用的是最朴素的那种叫Buy Copy,就是每卖一
份就赚一份固定的销售额的这种模式。然后所以就是很幸运,就很早的时候就有
了比较稳定的现金流。
主持人:对,这个有多稳定啊?现金流。
那个软件从第一个版本到最后我大概赚了三十多万美金。对,当时我觉得那个对
于一个高二高三的学生来说已经算是挺开心的一个事儿。而且关键是就是它的销
售的模式很清晰嘛,对吧?我不需要去考虑太多的,比如说这个AI Purchase、
应用内付款或者提供一些增值的这种模式,我只是非常老实的卖一份Copy,然
后你给我一份钱。所以其实对于我来说,维护的成本是比较低的,是一个当时还
行得通的一种商业模式。但后来大家都知道,就是移动端软件已经不太再支持这
样特别朴素的商业模式,因为大家都要先免费获取客户。
对,或者就说当时是一个很好玩的情况。因为那个时候从桌面互联网到移动互联
网,我觉得是有一次平台或者简单来说就有一个硬件媒介的变化,对吧?所以就
是你有一个新的媒介出来,即使你是传统的大厂,比如说国内当时的BAT,然后
海外这些公司,其实大家都是跟开发者一样众生平等,都在做一个全新的尝试。
然后那个时候其实就会有一段在我看来可能是蛮蛮荒期的一个阶段,所以你有很
多的机会去做这样的事儿,大家还没有反应过来后来的这个诸多的商业模式。但
你看反观现在AI,我可能就聊到哪说到哪,你就觉得很难的一点就是,AI虽然是
一个新的技术突破,但是实际上没有一个全新的平台出现。所以你看这回的话,
我觉得没有存在那个蛮荒期,就是无论是巨头还是创业公司,还是个人开发者,
大家反应都一样快,做的都非常的干脆利索。对,所以我觉得我算是赶了一个好
时代吧,当时。
主持人:这段创业怎么结束的?
这段创业其实我觉得没有一个明确的结束的那一刻,其实它是我创业的一个起点
。那时候我觉得还不能严格意义上来说称为创业,因为我只是一个学生个人开发
者,用一个最朴素的商业模式去获得了一定的现金流。但当时的话你有一定的现
金流,同时你要做一定的marketing,对吧?但是我也没有团队,就一个人就自
己在比如说在国内外的论坛发帖。然后当时国内也没有很成熟的那种支付渠道,
因为你知道现在App Store你可以用,比如说像支付宝微信,或者你用那个credit
card,你可以去付款。但当时我记得其实只能支持国际credit card,所以中国国
内基本是没有什么付费的。这感觉跟现在AI也挺像的。反正当时呢我就想那既然
国内我很难去获得现金流,那我在国内就只能赚吆喝。所以我那时候会破解自己
的软件,然后在国内论坛上发,就是你没钱你就给我捧个人场。
对,然后你在这样做的同时期你就获得了一些来自于比如说资本界的关注。所以
那时候也很好玩,就是我当时高二高三的时候,然后当时就是在参加一个当时感
觉还是比较有创业氛围吧,那时候中关村,然后我应该就在中关村参加了一个创
业活动,我有点想不起来是哪一个了。然后当时的话就认识了真格基金。对,然
后这个故事就非常简单,就是当时徐老师(徐小平)问我,小伙不错,你想创业
吗?然后我当然不想创业了,对吧?因为我既然有一个稳定的、我可以边上学边
躺着赚钱的一个现金流,那何必要创业呢?对,然后但是我觉得就是毕竟这个徐
老师对吧,这个大家可能当时都是比较熟悉的,因为他应该也是那个体系出来的
。然后当时我回家跟我父母提了一下这个事儿,然后我这方面确实感谢我父母,
他们就说这个你是值得去好好考虑一下的。
然后我觉得那个时候对我来说也是陷入一个纠结,就是我可以有几个选择,对吧
?我也许可以申请学校去上一个好的大学,走现在跟大多数人一样的一条路。但
另外一点就是我觉得App Store给了我一个特别好的一个正反馈,就是你只要创
新也许就能有回报。当然想的会比较天真,就是说我只要做出一个好东西,自然
就会有一个好的结果。然后当时其实我渐渐意识到,这个不是一个常态,我是很
幸运的踩中了一个时代的机遇。那好,其实我也许我什么时候都能继续去读书。
所以我就想那我其实现在优先考虑应该是一个机会成本。对,所以就是我当时就
拿了term sheet,然后决定这大学我不上了,我要去创业。
对,但是当时的话就是为什么接受真格的offer,其实也是他们给了我一个承诺,
就我觉得一直是就是这个承诺兑现至今,就是他们不会管我干什么,我爱干嘛干
嘛。对,所以我觉得这个其实对于一个学生来说,我觉得我能有的一个最好的选
择。所以当时的话我就拉上另外几个同学,比我大两届,他们已经保送去北大了
,然后但是又被我忽悠出来。但当时我们其实已经意识到,如果你还在做这样朴
素的一个按一个copy去赚钱的这个模式已经不太work了,那个时候已经感觉到
不work了,很明显。因为当时的话已经又过了两年了,然后这个时候你会发现无
论是国内还国外,尤其像第三方iPhone浏览器的这个市场里头其实已经出现很多
不同的玩家了,巨头已经回过味了。所以我们就觉得这个东西一定一定会走向一
个免费或者免费加增值的这条路。
但当时我们还做了一点最后的一个尝试,这也其实后面一切的起点。就我们觉得
我们既然要卖一款付费的浏览器,我们应该在功能上有比较大的一个跃进。首先
一点,当时那个Mammoth Browser它的交互体验确实比较好的。但当时其实还
有另外一个背景,就那时候无论是国内还国外都是3G初期的一个阶段,那时候
其实移动互联网远远没有像现在这样就这么的流畅。那时候可能大家还会更多关
注,就是说比如说网速慢的时候怎么办,弱网环境怎么办?
所以当时我就提出要解决一个问题,就是我们能不能去预测用户的下一次点击。
比如说那时候我还记得大家用Facebook,国内应该是用人人网,校内的那个改
名叫人人网嘛我记得。那时候大家很多人都觉得好像web版,就是移动端的网页
似乎比当时那些比较初期的客户端要好用。所以很多人其实是在用移动浏览器去
进行一些社交媒体的使用,所以你会经常有那种翻页、下页这个操作。然后呢后
来有更多人在手机上开始看新闻。其实我当时就觉得如果能准确预测用户的下一
次点击的话,我可以进行preloading,就是提前加载下页的内容,让它的响应会
更加的快。然后这个其实也就机缘巧合之下让我进入了NLP,就是Natural
Language Processing这一个领域,就是自然语言处理。当然现在大家可能不太
提这个词了,因为大模型已经把这一切给统一了。
对,然后那时候大概2011年开始,就是因为我这一个需求,所以开始研究这一个
方向。然后当时做,这个我就很……我很幸运点就是我感觉一直我在学习的东西
都是因为具体的需求在牵引。对,所以刚好也就跟自己兴趣都会比较align,所以
就接触这个行当开始做。所以那个浏览器其实真正意义上到后来它的结束是什么
?是我发现了更好玩的东西,就是自然语言处理。所以因为它的模式一直是很单
纯的卖一份copy,卖一份copy嘛,它就渐渐就变成了一个没有人去维护的一个
状态。然后随着比如说到最后应该是iOS系统不断更新,它的那个兼容的版本已
经就是跟iOS不兼容了,所以你自然而然就被从App Store下架了。所以这是一个
自然死亡的一个过程。当然我觉得这还是很幸运的,就是让我人生的第一个产品
就同时满足了出海加AI加上变现这件事,所以有一个很好的一开始。
主持人:现在反过去去说的话,浏览器这个事情当时怎么做,有可能后来摸到移
动互联网大牌吗?有这种可能性吗?
我觉得当时的话,我其实收到过一些收购的offer,我觉得也许卖的也挺好的。因
为我觉得其实浏览器……是谁的offer,这个就不要说了,对,不能点具体名。但
我觉得就是浏览器可能从古至今,包括今天,包括很多团队也在做AI浏览器(待
会我们会聊到),我觉得一直都是有一个点,就是它其实不是特别适合一个创业
者或者说一个颠覆者的形态来做,它其实更像是巨头你已经有了分发的渠道之后
,去锦上添花这个事。对,所以我如果回看当时的话,我不认为以现在的我的经
验或者阅历,我能做出什么更好的选择。
主持人:第二段创业呢?第二段创业的方向。
第二段创业方向其实应该刚才刚才讲的第一次真正的创业。就是因为在做这个浏
览器的时候,意识到就是NLP这个领域真的非常有意思。但那时候其实也是很有
趣,就是2011年,距离一个石破天惊的paper(我说的不是transformer),其实
2013年是,当时Google推出一篇paper叫word2vec,就是第一次能够把(也不
是第一次),就是较为可靠且高效的能够把自然语言文本离散化的自然语言文本
变成稠密向量。这个其实对我来说是我心中最石破天惊的一个转折点,因为它头
一次能让我们比较方便的把一些源自其他机器学习或深度学习领域的方法应用在
自然语言处理领域。
像当时比如2011年前后,大家做自然语言处理可能关注几件事,比如说你要进行
比较复杂的分析的话,可能会有一个技术叫做dependency parsing,叫依存句法
分析。当然现在可能这个词已经死透了,可能新一代做AI的人都不知道这个词了
。然后中文的话那时候我们还会关注额外的所谓的tokenization,当然跟现在的
大模型的tokenize相比可能会更原始一点,因为中文本身它会有这个要切分这个
问题。当然不止中文,就是中文、日语,然后其实德语有德语叫
decomposition,就是拆词这个问题。所以那时候做的还是一些比较为了自然语
言处理而做的一些比较专有的解决方案,它按现在话说是不太scale的。
因为其实你需要很重的标注才能做好,而且你本身的模型也没有那么的强大。所
以当时的话我觉得给我最大的一个触动是2013年的Word2Vec这个paper出来,
然后我觉得这一下新世界的大门就打开了。然后这个让我真正意识到我的兴趣可
能其实是在NLP而不是在继续做浏览器。然后也很感谢就当时真格兑现他的承诺
,我说我不想做浏览器了,然后真格说随便。然后当时的话我就看中了NLP,但
是其实也是看中另外一个市场机遇,当然回过头看我觉得是错的。这是怎么回事
呢?就是当时的2013年其实已经开始有传闻,就说苹果在筹备一款可穿戴式设备
,其实也就后来的Apple Watch。
然后这个当时给了我特别大的想象空间,因为我当时觉得那个时候的搜索还是你
输入一个问题一个query,然后他给你10个蓝色的链接。这个东西能够work的根
本原因是我们在与电脑这样一个大屏幕进行交互。那假设未来比如可穿戴式设备
或者说语音的界面,就是voice interface更加成熟的话,那这一个交互模式可能
就不work了。所以当时我想解决的一个问题是什么?就说我能不能以一种更结构
化且更紧凑的形式把知识跟用户之间的交互进行一次革命。然后这个当时就引向
了一个方向,就现在可能叫语义搜索,叫Semantic Search。这个东西我当时会
觉得这就是下一代的Google,我作为一个创业者,我会不会是当年的Google,
像当年的Google颠覆Yahoo那样呢?所以我们团队大家都很兴奋,然后我们想解
决的这个问题逐渐有了,逐渐也就细化了下来。
这其实是一个非常技术驱动的问题。我当时在想,如果你想用一个更紧凑的结构
去回答用户的任意问题的话,那其实你需要的不能是网页的原始信息。因为大家
都知道其实搜索引擎的工作原理,当时可能就使用倒排索引,就说你输入一个关
键词,它会把所有包含这个关键词的网页通过一些排序算法进行排序,把top10
给你。所以你用户输入的问题最后获得的东西仍然是原文,是自由文本。那这个
东西自由文本,你想象一下,如果你用Apple Watch,你不可能在上面就反复滚
动去读完;如果你是车机或者像Siri这种interface的话,你也不能让它去朗诵那
么长的文本,因为人的带宽听力的东西其实你会很着急。所以我们觉得当时从技
术层面来讲下来,它缺的是什么?是一个高效紧凑的representation,就表达形
式。
而那个时候我们想到的一个概念其实是知识图谱。知识图谱现在也是一个半截身
子埋在土里的概念,老词。对,但是当时我们也是有追求的团队。然后我们在知
识图谱这件事我们再往下下钻,看那到底是什么限制了知识图谱?我们当时找到
的一个切入点是,我们认为知识图谱其实完全都不够完备。因为那个时候你能找
到的知识图谱,无论是通用的还是行业领域知识图谱(也是一个很久的一个词
),它其实大量的依赖是人的编辑。比如说,如果你要在一个行业内,比如当时
有做些什么工业领域的知识图谱、科学领域知识图谱,其实都是需要一些专家进
行去标注,比如要标注的SPO,就是三元组这样的形式去进行标注。而通用或者
说通识领域的知识图谱,其实当时世界上有几个比较大的平台,有一个叫做
Freebase,好像后来是被谷歌收购了,他们就以一种众包的形式让大家贡献这
些知识。后来它应该演化成了Wikimedia Foundation下面的一个项目叫做
Wikidata,它里头做的就是比如说关于你,张老师,你是一个实体叫Entity,你
下面有各种你的属性,比如说你的这个出生日期、你的之前工作的场景、你的节
目是什么,这样你能形成各个实体之间的关系,这就是所谓的知识图谱嘛。
但很明显这个东西完全依赖于人类。那这个东西我觉得是我们探测到的一个瓶颈
,所以我们想找到一种技术来把这件事自动化。那当时的技术供给能做到什么呢
?就是刚才讲到那一个年代的NLP还在一个比较初期比较混沌的一个阶段。当时
要做的事情可能已经有的方案是这样:你可以首先进行叫命名实体识别,叫
NER,Name Entity Recognition,就相当于你读一篇文章的时候,你把里头所有
的实体能够由一个AI模型来标记出来。但这样的话你其实只获得到了实体,就比
如说张小珺这是一个实体,然后这档节目是一个实体。但是所谓知识图谱,图谱
之间是要有边的edge。那这个边是怎么来的呢?当时有另外一项技术叫做关系提
取,叫Relation Extraction,就是对于两个实体之间我能探测到,比如说张小珺
是这一档节目的主持人,那么“主持人”这其实就是一个边,或者叫Predicate(谓
语)。然后这样的话,我们用这两套技术能构建怎样的一个知识图谱呢?
就是说我如果能限定领域,那么我能进行很好的实体识别;如果我能限定提取的
关系的总类型,我也可以进行这个工作。比如说我提前知道这世界上有什么节目
的主持人是谁,这是一种关系;人的出生日期是什么时候,这是一种关系。那很
明显这个东西好像不可枚举,因为任何两个实体之间的关系它应该是一个无限集
。所以我们就意识到当前的技术肯定是有局限性的。那么我们当时就投入到了一
种新技术的研发。后来的话这个技术在学术界的定义应该叫做Open Information
Extraction,叫OpenIE,开放式信息提取。它跟刚才这些技术的区别就是说我不
需要提前定义一套规则或者schema,就是说我不用规定哪些东西是实体。因为
传统意义上的命名实体识别可能关注几类,比如说人名、地名、然后组织名这些
东西,你看这其实又是一个白名单机制。我们要避免这一层面的白名单。同时在
进行关系提取的时候,我们要避免提前预设的这些关系,而完全变成一个
schema-free的,就是说无大纲的形式的提取。
所以最后我们做到的一个技术是什么?就是说AI在阅读一篇文本的时候,它能够
自己识别出这里头有哪些潜在的东西是实体,以及这些实体之间的关系是哪些,
并把它们提取出三元组,并持续自动的构建一个知识图谱。所以这个在当时我觉
得还是很重要的一个技术。而且我们选择了最苦的一条路,就是我们从零训练模
型。而且你想这件事是从2013年底2014年开始的,我非常幸运又不幸的赶上了
NLP最跃进的那几年。所以我们一开始的话,当时是一条,我们团队分两边,一
边在做基于传统的依存句法分析的一个解决方案;同时呢,我这边在做基于
word2vec向量化的一个解决方案。然后做了几年之后,我们发现这个东西好像
可以去scale up,然后开始用LSTM去做;后来是LSTM加attention;再到后来呢
,我们觉得其实word2vec或者说LSTM加attention,它其实在输入层的信息损失
就很大,因为那时候如果你用基于纯词向量的方法去做的话,它无法分析分清楚
多义词的东西。
它无法分析分清楚一个完全同名的词的不同含义。我举个例子,比如孙悟空。孙
悟空可能是咱们中国传统文化中的孙悟空,可能是我举例子,像日本七龙珠里头
那个孙悟空,其实在后来还有王者荣耀里头的孙悟空。对,你如果完全基于这个
word2vec这种技术去做的话,你发现同样一个词,它在不同上下文中的意义都
被压缩在了同样的一个512或768位的向量中。所以当时我们就很苦恼,说能不
能再进一步,其实就需要有一个上下文相关的编码方式。
然后那时候我觉得那几年是非常幸福的一方面是什么?就是你基本上想什么这个
世界上就会发生什么。那时候再后来transformer出来了,BERT出来,那很好解
决contextual(上下文相关)这个问题。但是不幸的就是每一次这种技术迭代,
你会发现我们过去几年积累基本都算了,不用去做了。所以很痛苦。然后我们就
是当等于从2014年底一直做到2018年才把这事做完。我们当时所有的模型是自
己从预训练区开始做起的,是非常痛苦一事。然后也很早就开始…
主持人:这是多大的模型?
总共加起来我们有两个模型,总共加起来大概是两个0.3B的模型。那时候这叫大
模型,但是现在这已经都不算什么。对,然后也很早的遇见一些问题。比如当年
像BERT的话,它默认情况如果没记错的话,它的context length,或那时候我们
还叫sequence length是512个token。512我的天哪,就是你如果去掉,比如它
一开始的CLS跟SEP token,你只有510个token。那这时候如果我要让AI去自动
在互联网上去读网页的话,这个是完全不够的嘛。
所以我们当时从2018年底就开始解决long context的问题。但是那时候我们解决
的long context在今天看来很小的课,我们解决16K长度。对,然后这个我如果
没记错的话,那个模型后来我也开源了。反正我们当时就一直在做这个事。然后
就当时做了一个产品叫做Maggie。Maggie是来自于我很喜欢的一部动画里的一
个超级计算机。对,然后他做的事情就是如刚才所说,就是AI能够自己去到网络
上去看各种各样类型的不限领域的文章,并持续构建并更新一个知识图谱。
然后当时我们做的这个事按现在的学术定义应该叫lifelong learning或continuous
learning。对,反正就很好玩。然后这个项目其实做的我们是自己很嗨的。我到
今天也觉得这是我智力和我的编程和research能力的巅峰,在后来就人就已经逐
渐老灯化了,就水准开始下降。但是那段时间的话我们做到后面就会觉得很痛苦
,就是外界的创新实在是太多太快了。直到2019年的某一天我拿到GPT-3的
early access,我觉得天要塌了。
为什么?因为是这样,就我刚才讲的,我们当时选择很苦的一条路,就是一切我
们要做垂直整合,就是模型自己做,产品自己做。那好,我其实每一次产品的迭
代我等着我底下模型的完成。那时候模型现在还跟现在比简直非常小,但是同样
evaluation这事也很恶心,你的infra也要自己去搞。所以我们当时迭代的周期基
本是两到三周能有一个模型的迭代。但是两到三周在当时的外部这简直是巨变了
。
然后拿到GPT-3的时候我测了一下,我觉得天塌了的原因是什么?我们把同样的
任务,我拿GPT我随便写了一个prompt(那时候大家也没有什么prompt的艺术
,都是胡写),我发现它好像跟我们自己训的端到端模型五五开。而且我当时就
意识到一个问题就是……
它虽然现在很贵,但是它是一个通解。就是那个时候我们比如在NLP领域内,大
家互相交流,你会有很明确的感觉,就是比如我跟别人自我介绍的时候说,你好
我是Maggie团队的,我们是做信息抽取的;然后这边可能是做机器翻译的;然
后这边是做客服系统的。大家泾渭分明对吧?就互相握手,就互相学习。但
GPT-3出来之后,其实它印证了一件事,就是好像我们做的不同的任务是能够大
一统的。其实它不是第一个工作,就之前其实Google一篇叫Flan-T5的一个
paper出来,已经当时有这个苗头了。但是那个时候大家还觉得,Google土豪太
厉害了,做出一个很好的Demonstration,但是你要吹这领域还还得靠我们。但
是GPT-3出来之后,就彻底就把我们那条心给给给摁死了,你知道吧?所以当时
我的第一反应就是赶紧卖掉公司。
主持人:卖了吗?
卖了。
主持人:卖谁了?变现了是吧?
其实……你好先进,我停一下。就是你从11年做的事情,感觉和现在大家做的事
情差不多,我觉得就是顺着做了一遍。
我觉得不能这么说。就是你应该说大家在每一个阶段遇见的问题是类似的,但是
你每一个阶段其实都未能解决未来大家再次遇到的时候的问题。比如我们当时说
的Long Context,从512个Token到16K,现在的Long Context可能是指的比如
说200K到2M,对吧?所以我只是说历史的话,它会押韵,那肯定不会重复这个
东西。
主持人:你们当时做这些,你的目标是什么?因为我感觉一直在顺着这个技术往
上爬,但你的目标是什么?
对,我觉得这是一个很好的问题,也是上一次创业中,我觉得我没有想通那个事
。就是可能那个时候还是年轻,包括现在我看到很多跟那时候我一样年轻创业者
,大家我觉得优点是什么,就是非常的遵循自己的本心,比如你喜欢什么事,你
就先把这事做下去。当然你可以好点说,就是如果你看中了一个技术问题,且这
个技术问题真的别人没解决的话,那它往往可能会是符合第一性原理的,就是说
它是一个很重要的待解决的一个问题。对,所以当时的话我们遇见,如果你现在
切到产品侧,可能会有几个问题。
第一点就是我们会觉得应该做一款很成功的搜索引擎,来替换掉Google。但实
际上首先我们低估了搜索引擎本身这件事。这个其实当时很多人不知道,就是
Maggie这个项目,我们没有使用任何第三方的搜索,我们从爬虫到搜索引擎,
全是自己去建的,自己手写的。对,我觉得那是我工程能力的巅峰。对,然后我
们其实低估了一件事,就是说你光有技术,其实你解决不了一些非技术问题。比
如说现在我都不太看好,你再做一个新的搜索引擎。因为比如很多的数据源跟
Google已经形成了一种,就是他们之间也是一个互利互惠的,一个可循环的一
个关系。你再以一个搅局者入场的话,其实你无法重复谷歌过去20年来积累的这
些数据源的这件事。
对,所以当时我们就觉得,产品一方面是我们的技术和非技术原因没做好。另外
一点我们当时很期望发生了,就是有一个新一代的可穿戴式设备,或者全新的人
机界面的出现。这个东西可能到今天为止,也许可穿戴没有充分的落地,对,同
时新的人机界面,也许是直到ChatGPT才真的落地。所以我我觉得产品层面的错
误,一个是技术,一个是可能确实是早了。但是创业就是这样,你早一步就先烈
,对吧?所以不对,早一步是先驱,早十步就是先烈。对,所以当时我们就先烈
了。
然后第三个,我们觉得当时商业上也没有想的特别清楚。对,所以一开始想的是
做一款完全to C把这个做大,但后来其实因为做了很多年,技术不断迭代,你会
慌,所以又想能不能直接做一些to B,但明显团队的基因不是这样的。对,所以
我我觉得那一段创业经历其实让我学到了很多,当然特别爽。
主持人:然后特别爽,就是因为那是一个我觉得很多创业者梦寐以求的一个状态
,就是我就想把我人生的夙愿给做完。夙愿是啥?人生的夙愿,你人生的夙愿是
啥?
就是我想自己从头,基于一切都是自己写的,自己写的infra,自己做的模型,去
解决一个别人没有解决好的问题。
主持人:可是Google这个事已经解决好了。
我(觉得)没有解决好啊。
主持人:你觉得它哪里没有解决好?
它是这样。首先Google是通过收购Freebase,对吧?它其实获得这个之后,它
只是获得一个很好的社区。然后它当时有一个并行的项目,叫knowledge vault
还是什么东西。然后我们跟他们做过head-to-head的对比,就是头对头的对比。
我们当时在最高置信度下的准确度,能达到89%点多,所以我们的准确度是比它
高的。同时我们不仅支持中文,还支持别的一些语言,包括右向书写的阿拉伯语
。这个现在可能大家不觉得是什么,但当年这还是比较厉害的一个事。然后同时
我们演还自己研发了,像那个向量搜索,那个现在可能也是比较常态了。我们当
时为了解决这个scale的问题,我记得是跟英特尔合作,找了一个新的方案。他
们当时有一套技术叫做P-MEM(持久化内存),我们自己写了一套向量,所以
基于那HSW的算法,然后去搭建了整套这个东西。
就是把我这辈子想试的技术,都以合理的方式花投资人的钱给搞定了。对,所以
我我觉得在那个项目做完的那一刻,我的人生就圆满了,你知道吗?所以就在后
来像包括现在做Manus这些事,我我心里已经没有什么就是那种,就是我要证明
自己或者我要做什么,这个才能死而无憾,我早就无憾了。所以现在我就可以一
个很轻松的一个状态,来做很多事。
主持人:所以你还去工作了?
对,我工作了一年半。那段工作经历其实非常开心,非常开心。
主持人:为什么?是个大公司吗?
当时还是一个独角兽状态,然后就相当于在临上市前的一年多。但是当时又刚好
赶上就GPT,就是当时我是因为GPT3的出现,我意识到危险了,所以相当于我
是在ChatGPT出来之前,一直干到了ChatGPT出来之后那一段。相当于我在那
家公司从零的做起了LM的业务。
对,所以那段期间怎么说?这个公司的一个工作模式,当时很多人不喜欢,就说
好像所有的research和算法岗位,大家都在公司内部打榜。因为那是一家2B的公
司,就B2B做AI to B。那AI to B的一个经典的问题,就是说你如何去量化用户的
收益?你除了一些比如最终的经营指标以外,你其实也需要一些过程指标。当时
的话有一个部分团队的任务是说,我把所有用户的需求转换为可量化的
benchmark。这个就是research和算法岗位最喜欢的事情,就是打榜。所以那时
候我的主要工作就是打榜。对,然后打榜又很开心,因为当时公司内部的一个激
励方案很有趣,就是公司内部有个类似Kaggle那样的一个榜单系统,然后你赢的
越多,你的奖品是什么?你能获得更多的显卡。所以你就会进入一种强者恒强的
状态,你知道吗?所以我当时一个人能囤好几十张卡,然后我一堆卡的资源闲置
,但是我就可以去捣鼓很多我想试的东西,因为总有客户会需要,对吧?所以我
可以做很多的实验,然后同时我的算力又是最充裕的,我能scale up。所以我在
那一年半里头,我一直霸榜在第一名。所以我我觉得那段经历特别开心。
主持人:你以前上学的时时候好像没有这个劲头是吗?你以前上学的时候是那种
特别喜欢比分数的学霸这种类型吗?好像不是吧。
不是。因为好多课我都没上。所以我特别感谢我的高中,当时在北大附中读书,
然后我觉得我特别幸运,就遇见了一群超级开明的老师。就是开明到什么程度?
就是有的课不想上,老师说那你就不上了。后来学校还给了我一个(也不知道一
个小顾问),我们有一个计算机社团,就相当于我在学校里有一个不上课都可以
去的办公室,有空调有电脑,让我好好地捣鼓我喜欢的东西。所以我我觉得太幸
运。
主持人:你第二段创业终止的那一刻,你在做什么?你在想什么?
我当时的想法是这样,就是我知道有一个新技术出现可能要杀死我,那这时候我
的选择是什么?当然是选择加入了,对吧?然后但当时的想法是,我刚刚经历上
一次创业的一个创伤,就是你自己要做垂直整合真的很痛苦。就是每天醒了之后
,我常说一个比喻,就是每天醒了之后,你都感觉海水在上涨,但是你不知道会
涨到什么程度,也许你第二天醒的时候,就已经到鼻子这了,就很恐怖的感觉。
所以当时我想法还是我喜欢创业的,但是我不想做垂直整合了。所以当时会有一
个比较天然的想法,就那时候大家会把AI创业分为几个layer几个层,比如那时候
有模型层,有infra层(基础设施层)以及应用层。然后当时我就想,OK那我面
前其实也就三条路。那时候其实到了22年底、23年初大家看了ChatGPT之后,
其实国内很多基础模型公司已经开始动起来了。当然我也跟所有人都聊过,但是
没谁能说服我,就是这个东西到底该怎么办。因为我觉得我不太再想体验这种特
别难受的状态,所以我的更多的目光是看向了就所谓的基础设施层跟应用层。
但这时候其实也有一个问题,就是大家当时一直在说这个事,但是没人知道真正
的AI应用该长什么样。尤其你想二三年年中的时候,真正有PMF或者说有一定声
量的产品,可能就两个,一个ChatGPT,一个Character.ai。对。然后
Character.ai这种东西,我非常清晰我不懂这个东西,因为我用了以后我自己用
不进去,那我就知道你不是AI用户。
不是不是AI用户,那我肯定做不好这样的产品。而ChatGPT的话,这其实是一 个天时地利人和的一个状态。就是我之前也觉得,ChatGPT其实出来一瞬间 ,ChatBot的这场比赛就已经结束了。所以我明白我想做应用,或者做Infra层的 东西,但我没想好我要做什么。对,所以我就看一些机会,同时的话也就去,去 怎么看个相关的项目。然后在真格待了一段时时间对吧?对,在真格待了一段时 间,然后也算是跟更年轻的创业者一起交流,就把我过去的比如说悲惨经历跟教 训,可以提前告诉大家对。所以今天这节目,我也想跟大家分享一下悲惨经历, 对吧?对。
再到后来的话,其实也是当时认识了肖弘(Red),就我们现现在Manus的
CEO。然后他是怎么说服我加入,或者说为什么我要从第二轮创业之后,去开始
这个事。
主持人:你中间隔了多久?
当时就那一年半的时间。在真格待了一年半时间。对。
主持人:在真格一年半时间,对。然后那段时间,你就明确不想做大模型,不想
去任何的一个大模型公司?
我几乎跟所有的大模型公司聊过。
主持人:你有喜欢的吗?
Google。
主持人:Google?海内海外都聊了是吧?海外聊的,当时海外没几家,海外也
基本都聊了。然后国内的话也都聊了,包括当时那个…为什么是Google?你不是
要干掉人家的吗?
你没干掉他,你才会格外尊敬他。对。然后当时我的想法就是,我想找一款AI产
品,不是我自己去主导,而是一个很空的画布。就大概是这样的一个感觉。因为
对,其实上一次创业到最后,我其实还学会了一个很重要的事,就是我意识到,
我根本不是做CEO的那块料。就是我既不不喜欢商业化,我也很讨厌管人。对,
所以我我觉得这是交了一个学费,就是我知道我不该做CEO,我我应该找一个比
我适合做CEO的人。
主持人:你觉得你是哪些方面不不适合做CEO呢?
我觉得完全就是一个情绪上就很抵触。情绪上就很抵触。
主持人:为什么呀?CEO哪些比较反人性?
首先有一点就是说,我与其跟电脑打交道,我很喜欢跟电脑打交道。但我得觉得
人太复杂了。就是你的组织在随着变大的时候,其实你的发现你这个复杂度其实
是指数级增长的。我觉得我不是那那块料,我搞不定太多就是人与人之间的更微
妙的这些事情。
主持人:你看起看起来比肖弘要外向很多。
不,其实我们公司除了张涛以外,全都是I人。
主持人:你是I人?
对。我只是开朗的内向,你知道吗?就是我再跟你聊,被你欺骗了。我再跟你聊
具体的业务的时候,我能讲很多,但是其实我…
主持人:你是I什么?
INTJ。
主持人:INTJ感都烂大街了,大家都差不多。
对,所以我我觉得首先管人,我觉得我不太行。第二点就是我有的时时候会陷入
一种特别追求“正道”的思路。
留下你的评论