由ChatGPT和文心一言掀起的大语言模型浪潮到来,国内创业者、投资者闻风而动。已退休的美团二号位王慧文再次出山,出资5000万美元招揽“AI英雄”,意欲打造中国的OpenAI。八字还没一撇,已有顶级VC认购2.3亿美元,源码资本创始人曹毅甚至发朋友圈道贺“行业等到了老王出山”。
2月20日,复旦大学自然语言处理实验室突然发布了大模型MOSS,并称其为“国内第一个对话式大模型”。发布当天,服务器就因流量过载而崩溃。
(资料图片仅供参考)
创业者、研究员、投资人,人人都渴望能打造出下一个OpenAI。但这远不如想象的那么简单——资金、数据、人才等硬性资源建起门槛,从根源上决定了大语言模型只能是谷歌、微软、百度等“巨头的游戏”。
根据《国盛证券》估算,GPT-3训练一次的成本约为140万美元。对于一些更大的语言模型,训练成本介于200万美元至1200万美元之间。目前,模型持续优化后的训练仅耗电就达到40万人民币每小时。也就是说,王慧文5000万美元的资金,实际上也就只够几次训练而已。
一分钱难倒英雄汉,此外,训练大语言模型需要的海量数据(603138)(维权)也是创业企业难以企及的资源。OpenAI在GPT-2阶段,就为模型训练准备了包括800万篇Reddit论坛帖子的文本包;GPT-3阶段,OpenAI的科学家把此前 12 年从6000万个域名中收集的新闻报道、帖子、书籍全文以及各种网页等数千亿个单词的英文资料输入模型进行训练——国内市场,这些数据资源大多掌握在头部大厂手中。
当然,顶尖的AI人才也是不可或缺的一环。ChatGPT团队共87人,绝大多数拥有名校学历且具有全球知名企业工作经历。人才的培养与揽招,需要完善的人才体系、充足的资源与号召力,这方面显然头部企业更有优势。
面对多重硬门槛,创业者想与头部企业在大模型训练上一较高下,并不是一个聪明的做法。但他们并非完全被排挤出游戏之外,在ChatGPT和文心一言等底层大语言模型的基础上,创业者有机会通过上层应用开发和SaaS服务,跑出成功的商业落地模式,发展出新业态。
国外已有诸多类似的创业先例。2015年成立的DoNotPay号称“世界首个机器人律师”,在ChatGPT爆火后,DoNotPay就专门针对法律知识对其进行了新的训练,将技能扩充,可以为用户处理停车罚单业务、起草离婚文件、向政府申诉盗窃罪名等。最近的一轮足足1200万美元。DoNotPay A轮融资就达到1200万美元,一年后又拿下1000万美元的B轮融资,2021年估值就已达到2.1亿美元。
还有一家名为Jasper的AI独角兽,通过调用OpenAI的GPT-3模型为用户提供文生文写作服务。2022 年 1 月,Jasper 团队只有 9 人,10 个月后扩大到 160 多名,年营收预计达到 6000 万美元。2022 年 10 月,Jasper 融资 1.25 亿美元,在成立仅 18 个月后就达到了 15 亿美元的估值,市场对其的认可与期待可见一斑。
OpenAI CEO山姆 阿尔特(300825)曼也对这些基于GPT模型创业的企业寄予厚望,他相信这些公司所做的1%的训练,对于大语言模型技术的实际应用来说至关重要。并且,“这些创业公司将会非常成功”。
就像是移动互联网时代里,掘到最多黄金的企业,并不是打造了底层操作系统的安卓,而是抖音、微信、淘宝等在安卓系统上打造的应用。大语言模型的浪潮里,ChatGPT与文心一言也会催生出许多的创业和投资机会,这可能是一个更有潜力的市场。
对创业者们来说,与其与巨头们在投入巨大的大模型领域赛跑,不如站在巨人的肩膀上,去新的AI土地掘金。