简体中文 繁体中文

潮青访谈

新闻中心 > 潮青访谈

估值180亿!不到一年,这位90后潮青清华学霸干出一家AI独角兽

文章栏目:潮青访谈 发布时间:2024年02月26日


2月16日,OpenAI发布的文生视频大模型Sora成为焦点,OpenAI新一轮的融资和800亿美元的估值也让业界震惊。

进入2024年,大模型仍然是创投界热度不减的重点赛道。2月19日,有媒体报道,国内大模型创业公司月之暗面(Moonshot AI)在近期完成超10亿美元的融资,投资方包括红杉中国、小红书、美团、阿里,其他老股东也有跟投。这是自大模型创业潮兴起以来,中国大模型赛道金额最大的一笔单轮融资,投后估值约25亿美元(约180亿元)。

这意味着,作为一家成立不到一年的公司,月之暗面已进入国内大模型创业公司第一梯队,成为智谱AI、MiniMax、百川智能、零一万物之外的又一独角兽,为国内大模型领域的头部企业之一。

月之暗面的团队构成以其年轻、专业和经验丰富的特点脱颖而出。团队创始人杨植麟,虽然是一位90后,却在学术界有着深厚的积累。其不仅拥有清华大学计算机科学的专业背景、卡内基梅隆大学的博士学位,还曾与多位图灵奖得主合作发表过论文。其学术成就和行业经验,为月之暗面带来了强大的技术背书。


杨植麟(中)

保送清华的AI天才

杨植麟出生于1993年,来自广东汕头,高中毕业于汕头金山中学。

中学时期,杨植麟被选拔进入信息学奥林匹克竞赛培训班,并拿到全国青少年信息学奥林匹克联赛中获得广东赛区一等奖,获得清华大学保送生资格。尽管已经保送,杨植麟在当年高考中还是拿下了667的高分,远超清华大学在广东的录取线。

杨植麟最初被清华大学热能工程系录取,但在大二时转专业进入计算机系。2015年,杨植麟以年级第一的成绩从清华大学毕业,随后远赴卡内基梅隆大学语言技术研究所,只用4年时间就完成了一般6年才能完成的博士课程,于2019年获得博士学位。


读博期间,杨植麟成了AI领域的风云人物。他作为第一作者发表了两项深度学习领域的关键研究成果——Transformer-XL和XLNet,这两篇论文在学术界产生了重要影响。而杨植麟本人的学术引用量自2019年起到现在,已超2万次。此外,他与多位图灵奖得主合作发表过论文,在ICLR、NeurIPS、ICML、ACL、EMNLP等计算机顶会发表论文20余篇,研究成果累计Google Shcolar引用超过17000。除了学术成就之外,杨植麟还在Meta的人工智能研究院和谷歌大脑研究院工作。


▲2018年杨植麟作为第一作者与图灵奖得主杨乐昆合作发表了论文“GLoMo: Unsupervised Learning of Transferable Relational Graphs” 


▲2018年杨植麟与图灵奖得主约书亚·本吉奥(Yoshua Bengio)合作发表论文“HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering”



▲2019年杨植麟作为第一作者与谷歌、卡内基梅隆大学联合发表:XLNet: Generalized Autoregressive Pretraining for Language Understanding,以及:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context两篇论文

据悉,Transformer-XL成为首个全面超越RNN 的注意力语言模型,该论文成为NeurIPS 2019与ACL 2019的最高引论文之一。XLNet则在20项任务上超越谷歌BERT模型。杨植麟同时入选了2019年度北京智源青年科学家。2020年11月,荣登“2020福布斯中国30岁以下精英榜”。2022年4月,入选AI华人青年学者榜单。

天才总是善于突破。“我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。”杨植麟曾这样说。

2016年,博士在读的杨植麟首次创业,以联创身份参与创立了循环智能,方向是运用NLP、语音、多模态、大模型等AI技术打造“销售科技”方案。循环智能成立后完成了6轮融资,投资方包括红衫中国、博裕资本、金沙江创投、真格基金等。2021年,循环智能与华为云合作开发了千亿级NLP大模型盘古大模型。


尽管在大模型领域已经有丰富的理论基础,又有充足的实战经验,但杨植麟此前一直觉得亚洲不存在做大模型公司的机会。

转折发生在2022年底。ChatGPT爆发后,杨植麟前往海外考察。在海外待了两个月后,美国对于AGI的“狂热”让他意识到:机会来了。

决定再次创业后,杨植麟加速了融资和招人的节奏,并在一个月内敲定了首轮融资,拿到了来自红杉等知名机构6000万美元的启动资金。

公司成立不到三个月,就组建起了40人左右、极高人才密度的技术研发团队,并将公司的方向确定为专注to C领域。

与清华同学创业 组建“天才”团队

杨植麟在接受媒体采访时曾表示,大模型研发的难度主要有三个方面:一是算法创新,这需要大量的研发投入;二是算法微调,在不需要创新算法的情况下,如何调整才能让它有效工作;三是工程实现,如果路径不正确或者bug过多,最终可能失败。

这些挑战最后都受一个核心指标影响,也就是人才密度。人才密度决定了这三个问题的解决程度。

于是,从一开始创业,杨植麟最先解决的就是人才和团队组建问题,这件事的优先级甚至高于融资。

月之暗面的创始团队有5人,其中4人来自清华大学。有媒体报道称,深入接触过杨植麟的人都曾表示,“他是一个天才。”


联合创始人周昕宇是清华大学2011级的本科生,毕业后加入旷视科技,专注于算法量产。他与旷视研究院基础科研负责人张祥雨共同撰写了ShuffleNet论文,该论文对移动设备上的人脸识别技术产生了影响。

值得一提的是,在清华时,杨植麟还曾和周昕宇共同组建了乐队。“他很喜欢摇滚乐,我感觉他有点后摇(后现代摇滚的简称,将电子音乐加入旧式摇滚,形成新的、更为轻松自由的音乐表达风格)。”有接近杨植麟的人表示。

之所以把公司命名为月之暗面,也跟杨植麟对摇滚乐的爱好直接相关。《月之暗面》是杨植麟最喜欢的摇滚乐队平克·弗洛伊德乐队(Pink Floyd)的一张专辑名字。这张专辑探讨了死亡、物质快感和短暂的爱情等主题,被视为摇滚乐历史上的一个重要里程碑。月之暗面正式成立的2023年,正好是这张专辑发行50周年。


联合创始人吴育昕同样毕业于清华大学和卡内基梅隆大学,后在Meta的人工智能研究院工作。期间,他还创建了Detectron2,这是Meta最受欢迎的AI项目之一。吴育昕在AI领域论文曾获得过2018年欧洲计算机视觉会议(ECCV)最佳论文提名。

联合创始人兼CTO张宇韬,同时也是循环智能的联合创始人,也毕业于清华大学计算机系,跟杨植麟一样师从唐杰教授。张宇韬的研究方向包括异构数据融合和知识图谱构建,在计算机顶级会议上发表过多篇文章。

2023年10月,月之暗面推出全球首个支持输入20万汉字的智能助手产品Kimi。核心特色是,相较市面上以英文为基础训练的大模型服务,Kimi Chat具备较强的多语言能力,20万汉字的输入在中文上也更具备优势。

2023年6月,科技媒体《The Information》盘点了中国AI初创企业Top5,分别为MiniMax、澜舟科技、智谱AI、光年之外(已被美团收购)以及杨植麟——唯一一位以个人名字入榜的参与者。

要做AI时代的“Super App”

不同于之前创业选择to B赛道,这一次杨植麟将方向调整为to C,他希望自己很团队能做出下一代Super APP(超级应用)。

定位to C,显示出月之暗面要做中国的Open AI的雄心壮志。杨植麟认为,大模型可能会分成to B和to C两个不同的阵营,而“To C是成为AI时代Super App的机会”,因此月之暗面坚定的加入to C阵营。

杨植麟谈到月之暗面愿景是“通过AI给个人提供更便捷、更强大、更个性化的普惠产品”,这种定位迥异于国内其他一些大模型头部玩家“赋能B端”的思路。月之暗面这支由90后组成的团队,展现出了与其他几家资深大佬领衔的大模型创业公司非常不一样的锐气。


To C的定位使得月之暗面更愿意专注在产品,也因此保持着一个相对更小而精干的团队。随着第二轮融资的落地,月之暗面的团队人数达到了80人。而国内其他几家估值相近的公司团队基本都超过了200人。

当前,月之暗面正研发通用多模态模型,预计年内推出。对现在的大模型创业公司而言,多模态模型确实是核心竞争点,尤其是OpenAI 首个AI 视频模型Sora的发布,再次给这一赛道添了一把火。但相较于文本,图像、视频等多模态模型训练成本均更高,需要的资金和人才也更多,月之暗面再次融资,或许也是为此在做准备。


手机扫一扫打开当前页面

关注公众号