首页 > 滚动 > > 内容页

云启资本合伙人陈昱:AI大模型突破核心在工程优化 应用落地符合“二八定律”_环球观焦点

来源:21世纪经济报道2023-06-02 07:30:05

近日,云启资本合伙人陈昱接受21世纪经济报道记者专访时表示,当前还在竞速中的国内AI大模型企业都有发展机会,核心在于不断提升工程优化和技术迭代能力,同时也要充分挖掘创新应用场景。

在他看来,生成式AI落地到应用场景中,将是80%存量应用升级+20%新应用探索的“二八定律”局面。也将给正在演进中的技术,如元宇宙、自动驾驶等,带来渐进式能力推动。

作为早期投资人,在面对AI大模型创业项目时,他更看好有野心、懂技术、执行力强的团队。


【资料图】

竞速AI大模型

追根溯源,如今火爆全球的ChatGPT背后,是Transformer架构的支撑。这一技术早在2017年被谷歌提出,2018年谷歌还提出基于Transformer架构的BERT技术等。

“其实无论是早期的CNN(卷积神经网络)还是Transformer,都属于在深度学习领域,行业探索过程中寻求的不同网络结构。恰好Open AI用解码器decoder only架构,证明了Transformer的可行性,并把参数规模从十亿扩展到上千亿量级。”陈昱续称,因此这一方面有赖于深度学习算法的持续发展;另一方面英伟达提供的GPU算力支持同样功不可没。

实际上,在早期路径探索中,谷歌认为decoder only路线可能会不如encoder+decoder(编码-解码)效果好,因此采用了另外一条路线,而谷歌内部长期有多个团队在做不同尝试。

最终Open AI持续迭代,加之RLHF(人类反馈强化学习)后,证明了decoder only路线的可行性。随着路线被证明,谷歌很快也推出号称可对标GPT4的大模型PaLM2。

“国内和国外有不同的大模型体系,投身AI大模型的国内企业,当前还是有一定机会。”陈昱对记者分析,目前GPT-4的水平可能已经达到了95分,国内很多产品在80分左右,但是并不存在代际差。

一方面,AI大模型公司需要花费更多时间在工程优化和技术迭代上;另一方面,更需要产品经理的创新能力,充分挖掘AI大模型的创新功能。

“我觉得这一轮,微软在创新应用方面做得比绝大部分公司好,近期微软密集发布新功能,比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等。”他进一步表示。

不过有行业观点认为,Open AI更多是证明了Transformer架构路线的可行性,在具体落地时,或许未必要重投入,而是可以考虑小模型发展路线。

“目前业界存在不同观点。”陈昱对记者分析,一部分人认为,小模型可能存在诸多优势,如资源消耗较少、成本低,而成本低就是跑通商业模型的重要一环;同时,当前“大力出奇迹”的AI大模型中集合了太多数据量和能力,但实际在应用中或许未必需要。

但另一部分人认为,AI公司最终的发展目标都是瞄准通用人工智能(AGI),也即类似人类的大脑,在运转过程中并不会分区,而是可以同时多路线思考运行,甚至各分区之间会互相作用,产生意想不到的效果。这条思路之下,就意味着需要大模型最终“一统江湖”。

总体来看,当前业界对这两条路仍有分歧。“学术上也还没有证明,大模型是否的确是参数量越多越好。毕竟目前AI的运作还是一个黑匣子。”

当然他也认为,并不是所有企业都需要有自己的大模型。“训练大模型要从头开始,这意味着巨大的资源消耗,需要衡量投入产出比。有时调用成熟的大模型,取得的效果可能远比自己从头搭建和训练要好。”他强调,长远来看,综合考虑成本和收益是否算得过来账很重要。

如何改变未来

当前最受关注的,便是在生成式AI浪潮之下,对应用生态和相关底层技术带来的影响。

具体来说,数字经济、企业服务、SaaS服务等技术此前已经发展多年,通过引入更好的AI大模型能力,可以将既有技术进一步升级,把之前很难做好的体验真正做到满意;再如微软近期不断对旗下应用进行迭代升级,将极大提升内容生产力和工作效率。这都是由技术变革带来的体验变革。

生成式AI技术的出现,也将给正在迭代中的技术路线带来一定帮助,比如元宇宙和自动驾驶等。但总体带来的将是渐进式改变,而非颠覆式驱动。

陈昱对记者分析,AIGC对元宇宙的推动将主要在于素材生成。“元宇宙前期会在这方面花费较多时间,AIGC就可以帮助提高素材生成效率、节省创意时间。”

不过这并不能起到根本性推动作用。“元宇宙一直难以大面积落地,是因为暂时没有刚需的应用场景。AR/VR被视为元宇宙的入口,但目前遇到的难题是,还没有一款眼镜达到可以长期佩戴使用的效果。”他指出。

对于自动驾驶的改善可以包括感知和规划部分两方面。此前,自动驾驶功能运行时,传感器需要不断收集外部信息,进行标注。但有了AI大模型后,由于其具备zero-shot(零样本)能力,可能就不再需要具象到所有可能出现的物体样本进行标记。

而自动驾驶进程中,根据收集到的地图、实时视觉等信息后,该决策是加速、减速还是换道等,就可以运用到AI大模型的推理能力,这将会比现有自动驾驶所用模型做到更好的效果。

与此同时,AI大模型还在不断渗透到软硬件层面,如近期ChatGPT推出iOS版、百度为此推出硬件产品等。不过陈昱并不认为AI大模型的出现,会对既有软硬件生态带来太大角色改变。

“我认为改变的可能是搜索生态。”他续称,比如ChatGPT就可能成为谷歌在搜索方面的竞争对手。这意味着对用户使用习惯没有太大改变,改变的只是获取信息的途径。

从社会影响来说,陈昱认为,这将对整个教育体系带来巨变。可以类比此前计算机出现后,复杂的珠算、五位数乘法等学习,到今天多被计算器所取代,人们可以把脑力放在其他更有创造力知识的学习中去。“如果能够利用好AI工具,帮助我们人类完成此前80%的工作,剩下20%可以更好地施展创造力和想象力,同时也会带来新的职业畅想和组织范式。”

x 广告
猜你喜欢