大模型走到下半场,真正的“卷点”应该在哪?
公司动态 科技 财经 陆玖商业评论 · 2024-07-05 06:00:05
AI应用,不必“巨无霸”

一方面,让普通人以更小的成本,去了解和使用大模型和AI应用;另一方面,企业也能在不断的AI应用中,了解模型使用的具体场景,以及能带来的实际价值。

image.png




自2022年底大语言模型面世以来,全球范围内便掀起了新一轮AI浪潮,有的甚至最快是“以周为单位”进行产品迭代。

 
根据一些公开资料,截至去年10月,国内发布的大模型就已超过230个,而6月份的时候这一数字还不到80个,短短4个月的时间就翻了近三倍。“百模赶考”实至名归。
 
然而行业走到今天,有不少从业者发现,大模型的终点并不在数量的多少,诸如“我们真的需要这么多模型吗”“模型之间卷规模到底有没有用”“那真正的卷点应该被设定在哪”等这般话题,正被业内反复讨论。
 
产生这种质疑之声的原因,其实不难理解。毕竟放眼于应用层,除了基于开源大模型不断调优的“套壳应用”,真正称得上“能干”的应用,却是凤毛麟角。
 
这也正如百度创始人李彦宏在上海世界人工智能大会上所说的,“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”换言之,在广泛的、实际的场景中,企业真正需要的是超级能干的应用,有能力去解决实际问题,而不只是一个看似很大的超级应用。
 
随着大模型“卷应用”的浪潮逐步在金融、交通、政务等领域落地开花,更多的人开始意识到,生成式AI的下半场,或许更大的机会在应用上。而中国的AI产业,有望从应用层实现弯道超车。


01

警惕“超级APP陷阱”



从PC时代到移动互联时代,互联网产品的形态与发展路径,是截然不同的。

 
近二十年前,受限于通信技术与硬件水平,软件产品的容量不可能做得太大,承载信息的能力自然也有限。
 
随着硬件算力和通信技术的发达,智能手机作为应用终端,开始成为信息集散地。在这个时代成长起来的互联网大厂,无一不靠大DAU,大用户量的“超级APP”,触及用户生活的方方面面。也据此完成了“前AI时代”的资本积累。
 
当互联网走入生成式AI时代,以往“一个超级APP”走天下的逻辑,是否还能通用?但如今,这也变成了一个值得商榷的问题。
 
毕竟此前几乎无人可以预见,在人工智能时代,用户最常用的AI功能是什么。到目前为止,C端用户最常使用的AI功能,多用于文档解析、初级文案生成,文生图、文生视频虽然在商业领域已经有初步引用,但水平依旧无法在短时间取代专业人士。
 
基于同样的原因,虽然底层模型已经初步产生马太效应,资源和商业效益开始向头部大厂聚集,但像移动互联网时代超过1亿日活的“现象级应用”,却尚未诞生。其中一个原因,是大语言模型的所有能力,尚未被应用层开发者挖掘完毕。
 
与之相对的是,除了少数行业人士,市场对于生成式AI应用的认知和关注点,更多落在基础模型的进展上。而李彦宏和百度,则更多希望通过站位未来,来调控这艘大船今天的业务方向。
 
相较于移动互联网时代动辄比拼DAU规模,李彦宏认为,不同时代下,应用的发展路径和模式都是不一样的。避免掉入“超级应用陷阱”,不要用移动时代的思维看问题,这是其在本次大会上给出的一个结论。
 
在他看来,AI时代下,“超级能干”的应用远比只看DAU的“超级应用”,来得更加重要。“只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。”李彦宏如是说。
 
仔细想来,其实这并不难理解。
 
眼下及未来很长一段时间里,如果再像移动互联网时代那般,把绝大多数精力放在底层模型,一来,不断地重复开发基础大模型,也是对社会资源的极大浪费;二来,也是更重要的是,这或将错失更大的机会,特别是锚定产业价值层面的机会。


02

卷模型与卷应用,从来不是二选一



在人们讨论AI大模型数量过多的时候,伴生而来还会注意到另一个现象:数百个大模型问世,这些大模型之间的差异性到底体现在哪儿?而仅从国内生成式AI的竞争演变,就能看出这个情况——
 
过去一年多,无论是模型层还是应用层,都出现了从“百模大战”到“补贴大战”的转变,起码在底层模型层,行业已经出现相对饱和;另一方面,行业出清的迹象已经产生。以文心一言为代表的世界领先水平的一批国产大模型已经出现。
 
从过往连篇累牍的报道中也能发现,从无到有训练一个底层大模型,数亿乃至数十亿的资本投入、一卡难求的算力投入、可遇而不可求的AI细分行业人才,只是万里长征第一步。后续的模型迭代、生态培养等成本,远非中小AI团队可以承担。
 
正因如此,对于行业的大多数人来说,除非是成规模的大厂,抑或是拿到“龙傲天”剧本的明日之星,卷模型都是一个“无底洞”。无论是积累用户,抑或是解决实际场景下的实际问题,都是应用层的机会更大。
 
而在这个过程中,行业大模型有关开源、闭源谁更具有优势的争辩,一直未曾停止。
 
支持开源的行业人士认为,开源模型的意义,在于所有团队都站在一个起跑线上,拿着同样的厨具和食材,能炒出什么样的菜,各凭本事,这是一种公平竞争。
 
但大模型的开源,或许与一般意义上的软件开源,存在根本上的差异。譬如一般软件开源时,开发者可以获取软件的源代码,并据此修改或者增加新功能。
 
大模型内部代码,则分为预训练代码、微调代码和推理代码三层,对于微调代码,市场上已有很多公开方法。而大模型要被用起来,需要推理代码,至于训练过程和数据集,往往也是大模型厂商的核心所在。此外还有算力层面的考量。
 
在这种背景下,拥有经验证商业模式的闭源模型,更适合在竞争激烈的大模型行业里聚集人才和算力,进而实现商业化落地。这也是李彦宏的判断。
 
尽管在大会上,他并未否定开源在某些环境中的使用价值,但他也提到,“当你处在一个激烈竞争的市场环境当中的时候,你需要是让自己业务的效率比你的同行更高,成本比你的同行更低,这个时候商业化的闭源模型是最能打的。”
 
当然更值得强调的是,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。所以,我从去年下半年就开始讲大家不要卷模型了,要去卷应用。”
 
李彦宏透露,在更通用的领域当中,比如说代码生成,像文心快码这样的软件,在不同的领域正在逐步的渗透,“而在百度内部,我们有30%左右的代码,已经用AI生成的,代码的采用率超过了44%。”

03

下一个爆发点在哪?



无论是重构的百度文库,抑或是作为底层模型能力终端的文心一言,都只是生成式AI应用落地的初步形态。在李彦宏看来,智能体是大模型落地最有前景的发展方向,也被认为是最接近AGI的方向。
 
从具体功能来看,智能体不止有对话能力、还有反思、协作能力。在未来的行业应用上,多个智能体协作,去解决复杂的任务,将是非常前沿的技术趋势。某种意义上说,这也是“超级能干”的又一种体现。
 
“制作一个好的智能体通常并不需要编码,只要用人话把智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了。”随着基础模型的日益强大,开发应用也越来越简单了,智能体也成为李彦宏最看好的AI应用方向之一。
 
事实上,百度对于智能体的布局较早。早在去年4月份,基于文心一言的文心智能体已经上线。今年6月,中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——“农民院士智能体”正式发布。
 
智能体学习朱有勇院士的研究成果以及相关的农业知识之后,农民只需通过简单的提问,就能得到关于旱地稻种植条件、培育技术、病虫害防治等实际问题的专业解答。
 
值得一提的是,在文心智能体的平台上,已经有16万多名开发者和超5万家企业入驻,覆盖了100多个应用场景,智能体生态已然初具规模。
 
在无数个细分领域,随着各行各业对于生成式AI的理解不断加深,基于闭源小模型的智能体,也将为行业增效发挥巨大作用。企业多数重复琐碎的工作,将会被“超级能干”的智能体所替代,人类大脑深处的潜能,将会投入到更具创造性的工作中去。
 

而这,就是“超级能干”的大模型应用落地的价值内核:一方面,让普通人以更小的成本,去了解和使用大模型和AI应用;另一方面,企业也能在不断的AI应用中,了解模型使用的具体场景,以及能带来的实际价值。


0 人收藏 0 人喜欢
分享至:

0 人打赏,共 0

相关推荐

财经 科技
宜华投资因违规被警示:今年已有950家私募注销

近日,中国证券监督管理委员会广东监管局(以下简称广东证监局)对汕头宜华投资有限公司(以下简称宜华投资)及其公司法定代表人、总经理林某采取出具警示函的监督管理措施。

公司动态 财经 实时观察 金融虎网 · 201浏览 · 10小时前
浙江瑞安湖商村镇银行被罚95万元:今年上半年近40家村镇银行被吸收合并

7月22日消息,国家金融监督管理总局温州监管分局发布行政处罚信息公开表。处罚信息显示,浙江瑞安湖商村镇银行股份有限公司因3项违法违规行为被罚95万元。

公司动态 财经 银行 实时观察 金融虎网 · 205浏览 · 10小时前
百信银行2023年累计投放消费金融贷款超过1800亿元:净利润同比增长30.25%

近日,百信银行发布《2023年度环境、社会和治理报告》(以下简称“报告”),报告中系统展示了其在强化ESG管理体系、践行普惠金融、创新数智化能力等方面的可持续发展实践成果。

实时观察 财经 消金行业 公司动态 金融虎网 · 254浏览 · 11小时前
0 人评论
可输入 255
投稿
资讯排行