泉州市繁丰财务咨询有限公司(发布号)

当前的位置:泉州市繁丰财务咨询有限公司 >> 理解李彦宏:为何AI需要超级有用? >> 正文

理解李彦宏:为何AI需要超级有用?

发布时间:2024-11-15 08:11:37 来源:澎湃新闻

一年一度的百度世界大会,已经成为观察百度AI战略动向以及行业趋势的一个窗口。

在2024百度世界大会上,李彦宏看起来比去年更为笃定。他说,基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。

当2023年下半年大模型混战逐渐出现分野,李彦宏就提出「卷模型不如卷应用」。但从随后的行业发展动态来看,国内应用之「卷」集中在了类ChatGPT的AI助手层面,其他领域出现颠覆式创新的AI应用凤毛麟角。

其中一个原因,创新是有认知门槛的,开发AI应用也是有技术门槛的。

或许是意识到了这一点,李彦宏和百度今年进一步向大模型战略聚焦,押注智能体的爆发。

如果现在要问百度的第一性原理是什么,答案越来越清晰——应用驱动。李彦宏还给这个「应用驱动」加了一个有别于移动互联网时代的注解,「不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。」

01

「做工程不丢人」

过去24个月,万众期待的AI超级应用还是没有踪影。一些人不禁怀疑:全球性的大模型狂热究竟是一场新的技术革命,还是新一轮泡沫?

但如果默念茨维格在《人类群星闪耀时》中所写的:「那些历史的尖峰时刻都需要太长的酝酿时间,每一桩影响深远的事件都需要一个发展的过程」,旁观者或许会更笃定一些。

作为这股AI浪潮最早和最深的参与者,李彦宏提前看到那个「尖峰时刻」。他对AI应用即将爆发的判断,主要依据有两个:

其一,底层技术突破。过去24个月,AI行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升。基于检索增强技术的进展,百度年初切入iRAG(imagebasedRAG)——即检索增强的文生图技术,进一步让文生图也能消除幻觉,从而让AI在影视、漫画、连续画本、海报制作等领域落地。

▲根据「爱因斯坦在天坛」提示词生成的图片左为文心iRAG作品右四均为其他大模型生成作品

其二,大模型调用量爆发,开发者觉醒。今年5月,文心大模型API日调用量达到2亿。当时百度高管们在会上讨论一个问题,大模型怎么就算「成了」?李彦宏给出的量化指标是,日均API调用量一年内涨10倍。这说明大家是真需要。到11月初,文心大模型的API日调用量超过15亿,比预期发展快了不少。

还有一个现实原因是李彦宏会上并未展开的——调用成本。过去两年内,大模型每个Token的使用成本下降了超过99%。以美国为例,现在大模型处理100万个Token的成本仅为60美分。在国内,百度的一些模型甚至免费提供。

从会上传递的信息来看,百度目前重点押注两大应用方向:面向toC端的智能体,以及面对toB端的产业应用。

据我们观察,在toC端,大模型技术应用的广度可能比技术乐观派的预期还要高,因为许多使用场景并不局限于App等传统产品形态。

比如我的一名律师朋友,有时会让AI帮着做一个简单的法律协议,他自己改改就能交给客户。如果是其本人拟这份协议,最起码要用半小时。完成这一交互,他甚至不用专门下载AI工具类App,只通过一个法律行业公众号就能轻松获取。

可以说,AI应用场景无处不在,但产品形态未必跟从前一样。去年在大模型爆发之初,人们就憧憬着AI的iPhone时刻将在大模型领域复刻,诸如移动互联网时代的《愤怒的小鸟》、Instagram等超级应用,也会很快在大模型领域出现。

一年后,超级AI原生应用还没有出现,但新的共识逐渐形成:智能体将会成为AI应用的主流形态——

数月前,OpenAI发文称,在谷歌、苹果等科技巨头的带动下,2025年将是AIAgent最终成为主流的一年。在百度世界大会上,李彦宏再次给出智能体的判断:智能体是大模型最重要的发展方向,即将迎来它的爆发点。

按照AGI的进化顺序框架,智能体被视为Copilot的下一个阶段,它们具备一定自主性,能够执行长期任务,比如与环境进行多次交互、协同工作等,并且拥有自我进化能力。

目前全球很多顶尖科技公司都在关注智能体,但李彦宏在会上透露,百度已经把智能体作为大模型的最重要战略方向。

理由就在于,智能体的门槛足够低,天花板又足够高。去年行业已经意识到应该卷应用,但具体怎么做、怎么从模型变成应用,这里面有太多不确定性,也让很多人望而却步。从移动互联网时代的产品形态变化来看,每一次降低产品门槛,都会带来一个应用范式的爆发。最典型的是从App到小程序的迁移,微信生态从中受益匪浅。

智能体也有相似之处。当平台为开发者提供了一个高效、简单的路径,在大模型上构建智能体越来越方便,「势」就会汇聚起来。像文心智能体平台上,目前已吸引了15万家企业和80万名开发者,每周都有上万个新的智能体被创造出来,其中还有11岁小学生创造的智能体,然后通过搜索和其他渠道分发出去。

不过从李彦宏的发言来看,百度不是要推出一个超级应用,而是要帮助更多人、更多企业打造数以百万「超级有用」的应用。

言外之意,百度在AI时代的生态护城河宽度,未来要靠这些应用来构建了。

由此就不难理解,为什么AI领军人物中没有比李彦宏更着力于应用落地的人了。百度的AI优势,更多体现在底层技术和模型层。而技术的成功与否,最终取决于它在真实生活中的应用。就像DeepMind创始人、微软AICEO苏莱曼在最近的一次交流中所强调的,一个没有明确用途的AI模型,不过是一个引人入胜的计算机科学展示。

02

「自由画布」式的智能体开始涌现

智能体的爆发离不开「有用」。

李彦宏此前提醒,要避免掉入「超级应用」的陷阱。在AI时代,「超级能干」的应用恐怕比只看DAU的「超级应用」更重要。

结合国内主要智能体平台上的案例来看,目前公司类智能体、角色智能体、工具类智能体、行业智能体是几个主要发展方向。

这其中,公司类智能体被认为是于AI时代的公司官网。结合百度的搜索引擎底色,我们认为,这一类智能体是百度搜索的增量机会所在,公司类智能体是百度升级与KA客户关系、提供更多价值的一个触点。

据百度官方数据,比亚迪的官方智能体上线后,销售线索转化率提升了119%。

不过在整场世界大会中,参会者最感兴趣、最能让人眼前一亮的当属工具类智能体「自由画布」。这个由百度文库和百度网盘联合发布的AI创作新物种,在面向公众开启邀测首日,已吸引超20万人排队预约。

根据现场演示,「自由画布」就是一个由文心多模态大模型加持的万能白板,是百度文库、百度网盘行业首创的内容操作系统。

通过大模型技术,「画布」打通了公域与个人授权的私域内容,通过「一拖一圈」的极简操作,实现对多格式、全模态文件的混合理解、生成、创作,并支持对富媒体文档的一键分享和存储,实现了输入、编辑、创作、分享自由。

今年9月,百度集团宣布,网盘C端业务重新划归移动生态事业群组(MEG),并由百度副总裁、文库事业部负责人王颖接管。如果当时不少人还对这一决策逻辑感到不解。如今「画布」揭幕,通过AI能力进一步打通和重构,文库和网盘已经成为全新的智能生产力。

在上述四类智能体中,从商业化角度,《降噪NoNoise》同样关注行业智能体的前景。仅以保险行业为例,此前有专注大模型toB方向的AI创业者告诉我们,在这个30万亿规模的市场,部分保险经纪人的佣金能占到客户投保金额的20%-40%。如果大模型将保险专业知识沉淀为AI产品,继而能在一些简单险种上为客户制定投保方案,会非常有前景。

比如号称「免费AI律师」的法律智能体「法行宝」,上线半年已经回答超1660万个法律问题。产品信息显示,该智能体由百度自己下场创造的,主界面提供对话交互以及法律计算器、智能法律文书、在线法律意见书等免费工具,还有相似判决案例链接可以查阅。

比如用户可以就一起交通事故、一次工伤,询问赔偿方案、如何计算索赔金额,也可以请智能体代写一份起诉书。以往有这些法律咨询方面的需求时,普通人要么付费求助于专业律师,要么自己在繁杂的互联网中搜索,但要同时承担信息不全或者不准确的风险。

当然也有律师指出,基于专业知识积累和个人经验而提出的法律策略、分析判断等专业法律服务,是AI目前还很难做到的地方。

换个角度想,这或许正是智能体未来的想象空间,因为智能体本身是一个有自主性、会持续学习和进化的产品形态。

不过有必要指出的是,并非基础设施齐备了,就会出现智能体的涌现。一个应用方向的爆发,离不开清晰的商业化刺激。2012年,当《愤怒的小鸟》登陆iOS平台并且大获成功后,通过iOS端的下载付费和安卓端的广告植入,其背后的游戏开发公司当年收入较上一年增长101%,达到1.5亿欧元。

关于这一点,OpenA联合创始人山姆·奥特曼也有预警。在最近一次专访中,他不忘提醒创业者:通过更快地拥抱新技术,你可能会获得短期的爆发式增长,但长期来看,你仍然需要构建一个能持续提供价值的产品或服务。「每个人现在都能做出非常棒的演示,但要真正构建一个成功的商业,那才是关键所在。那是最艰难的部分,而商业规则仍然适用。」

据我们了解,目前文心智能体平台已经逐步跑通商业闭环,实现智能体从开发,到分发,再到变现。单个智能体的单次转化最高收入达到了10万元,其背后是链接挂载、商品转化、线索转化、联盟广告和胶囊位等商业组件的全方位支持。

03

长期主义、理想主义、现实主义缺一不可

中美AI巨头经常被拿来对比。相比美国AI同行对于AGI的宏大愿景、以科学研究和底层突破为驱动的做法,从世界大会上的表态来看,百度是典型的工程思路、应用驱动。

会后接受《甲子光年》专访时,李彦宏直言,「做工程不丢人。做工程很有可能是比科学更早发现机会、发现规律的。」就像飞机是先飞上天了,人们才开始研究,原来有一个东西叫空气动力学。所以百度的AI路线是优先解决大家在场景和应用中遇到最多的技术问题。

乍看上去,这与李彦宏的社会标签有一定反差。百度10年1700亿研发投入的故事已经为公众所熟知,李彦宏的「长期主义」、「未来主义」标签也早已得到业内认可。

比如去年9月,李彦宏同马斯克、黄仁勋、奥特曼一起入选《时代》周刊全球AI领袖时,《时代》的评语就是,「李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。」在近期沙利文发布的《2024年全球AI生态全景概览》报告中,百度被列入AI-NativeGiant,与谷歌、OpenAI位于同一象限。

未来主义少不了理想色彩,但应用驱动的策略看起来又很现实。

看似矛盾的地方,或许取决于参与者如何看待人工智能革命的本质。如果AI会带来一次新的工业革命,那这场变革不是三五年就能结束的,可能会在未来几十年持续向社会的方方面面去渗透。作为置身其内的变革参与者,既需要耐心,也少不了源源不断的、真金白银的投入,然后以商业上的成功、生态上的高墙,保持在全球竞争中的头部位置。

正如李彦宏在此前受访时所预判的:未来两到三年,AI竞争会非常激烈,「至于说谁会是最后的赢家,我的看法是谁赚钱谁就能活下来。」

这或许是李彦宏不厌其烦的布道、呼吁大家做智能体、把AI用起来的一个初衷;也是百度一边自己下场做「自由画布」「法行宝」等智能体应用,一边做工具、做基础平台,不断去降低开发者应用开发门槛的动机。

比如世界大会上的另一个重磅发布——无代码开发工具「秒哒」,这个被李彦宏称为「迄今为止人类历史上最复杂的多智能体协作工具」,为的就是让每个人都具备程序员的能力,会说话就能做出应用。此前在设计领域,海外的Cursor和Replit等产品已经实现在不敲代码的情况下,只靠用户的自然语言指令就能生成应用界面。

▲百度发布的无代码工具「秒哒」,只要用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。

这类工具又个共通的底层逻辑——让普通人靠创意就能赚钱。如果类似想法能够落地,AI应用无疑距离大规模爆发更近一步。我们也注意到,尽管「秒哒」明年一季度才会上线,据悉已经吸引超过5000家企业排队测试。

沿着前面的思路,同样可以理解百度为什么没在OpenAI的Sora惊艳出场后,投入到中国版Sora的竞争当中。在李彦宏看来,Sora和多模态是两回事。Sora本质上是任意场景下的视频生成能力,这件事非常有意义,但真正做到需要长期烧钱。

但这并不意味着百度不做多模态,「我们非常非常看好多模态,也在多模态上有非常长期的投入,在真正有应用场景的地方,我们的多模态能力是非常强的。」百度只是选择更落地的方向推进。比如「自由画布」,便是多模态AI功能allinone的平台。

李彦宏在大会当日的专访尾声被问及有何寄语,他谈到,人工智能的革命不是三五年就结束,它更像是三五十年对于社会的全方位重构。需要长期主义、理想主义和现实主义三者相结合。

对于百度来说,未来与现实,或许正是AI战略的一体两面。

参考资料:

[1]《对话李彦宏:应用驱动是百度的第一性原理,基础模型两年一个大版本就够了》,甲子光年

海量资讯、精准解读,尽在新浪财经APP

猜你喜欢

Copyright © 2023 WWW.QZFFCW.COM 泉州市繁丰财务咨询有限公司 Corporation, All Rights Reserved.

网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图网站地图

泉州市繁丰财务咨询有限公司 版权所有