AI下半场,卷完大模型 卷应用-开放智能

AI下半场,卷完大模型 卷应用

 

图片[1]-AI下半场,卷完大模型 卷应用-开放智能

8 月 31 日,百度的大模型应用「文心一言」(Ernie Bot)最新版本正式向公众开放,获得市场热烈反响,首日活跃用户超 100 万,平台共计回复网友超 3342 万个问题。据七麦数据显示,推出不到一周,文心一言登顶苹果 App Store,下载量预估为 31.3 万次。火爆程度可见一斑。

和 GPT 问世时不同,今天的世界已经不缺大模型。

国内百模大战如火如荼,据赛迪数据显示,今年 1-7 月国内共发布了 64 个大模型,目前累计已经超过有 130 个大模型问世。考虑到如果从 0 到 1 训练一个大模型需要非常可观的财力、算力、人才投入,行业的竞争度卷到了新高度。

图片[2]-AI下半场,卷完大模型 卷应用-开放智能

图源:赛迪顾问IT深度第一期

国内卷大模型倒不是重复造轮子,而是实势所需。外有 GPT,内有巨头间入场,公司没有独家大模型,未来恐怕失去竞争力的基础。

同时,由于消费者和媒体对大模型抱有太高期望,用户调戏完一波新的 AI 后,实际使用量开始下滑。根据第三方网站 SimilarWeb 的监测数据,7 月份,OpenAI 网站与移动客户端流量月环比下降 10.35%。近期,分析机构 Gartner 在发布的生成式 AI 炒作周期报告中指出,当前大模型发展已达到「膨胀预期峰值」,在未来的两到五年内,要么实现转型,要么跌入幻灭的低谷。

百度作为国内在 AI 领域投入最久,也是最先拥抱大模型的科技公司,目前走到哪一步了,有着一槌定音的风向标意义。

01 大模型的风向变了

从去年 11 月 ChatGPT 问世算起,8 个月过去了。目前大模型最大的痛点,是缺乏落地的应用场景。聊天画图已经成为大部分大模型的「传统艺能」,好一点的能达到 60 分水平,但说要替你工作上班还为时尚早。美国第一大报业集团 Gannett 之前尝试过用 AIGC 来撰写文章,生成的新闻相当蹩脚,最后放弃。

大模型好比操作系统时代的 MacOS 和 Windows,移动互联网时代的 iOS 和 Android,连 OpenAI 自己也说过,语言模型只是第一阶段,甚至是很早期的阶段,是发展的基础,只是第一步。操作系统做得再好也不一定直接赚钱,更别说长久存活——今天谁还记得 Unix 和塞班呢?普通用户对聊天机器人的兴趣最多维持三个月。吸引开发者进入,做出流行应用、爆款应用才是这一波 AI 革命的关键。

图片[3]-AI下半场,卷完大模型 卷应用-开放智能

打开网易新闻 查看更多图片

Windows 和 iOS 非常强大,但不能叫车不能网购。拥有了生成能力的 AI 就像学会了某种外语的孩子,需要对话场景、额外知识才能表达更深更有用的内容。光是智商高不是智能,智能意味着适应自己的才能,在各种情景下体现出新的能力。

什么时候,家里的老年人也能熟练地通过对话使用 AI-APP 购物、出行,解决生活难题,就像今天用手机一样,大模型才算是真正普及了。

正因此,9 月 5 日,李彦宏在百度云智大会中提出了一句很有意思的论断,是这么说的:「卷大模型没意义,卷应用机会更大」。

这话有两层意思。第一层,百度已经卷完了基础设施了。根据全球领先的 IT 市场研究和咨询公司 IDC 发布的报告显示,文心大模型 3.5 能力超群,在 12 项评估指标中,一共拿了 7 个满分,综合评分第一,其中算法模型、通用能力等基础技术领跑全行业。

图片[4]-AI下半场,卷完大模型 卷应用-开放智能

图源:IDC《AI 大模型技术能力评估报告,2023》

第二层,属于上一个时代的 App 时代应该要结束了,而新的游戏开始了。李彦宏说这话时的语境是为「文心杯」创业大赛的颁奖致辞,他寄语的对象是一群以 90 后为主的 AI 原生应用创业者。

新游戏的确开始了,百度「文心杯」启动三个月以来,吸引了近 1000 个项目报名,项目超过 8 成为应用,行业分布多元,遍及生产力工具、营销、文娱、社交、电商等领域;其中选出 32 个具有创新性的潜力项目,接入百度智能云千帆大模型平台、进行基于文心大模型的 Demo 开发,参加路演;角逐奖项的 15 个项目的创始人一半都是 90 后,最年轻的则是 98 年生人,优胜团队最高能获得一千万早期投资。

百度非常清楚,大模型不能没有,但大模型不是全部。李彦宏说「模型本身是不直接产生价值的,基于基础大模型开发出来的应用,才是模型存在的意义」。就如同说,土壤虽是农业之母,种果树才得丰收。

02 AI 应用创业的第一视角

种一棵树,最好的时间,就是现在。此次 AI 创业的关键问题是:人工智能如何「思考」业务?回答这个问题前,我们通常会先去想,人类如何思考业务。

「给你 1 万块钱帮我去买一辆最适合我的摩托车。你不懂摩托车,怎么办呢?你需要去学。打开一些网站,网上去看看最流行的摩托车,去读他们的评价、看他们的介绍,找一些销售咨询网或者看小红书,看一些工具贴,回来问我要什么型号、在什么场景使用,就这样,你慢慢就成为了一个摩托车的买手。我自己不懂,把这个过程交给 AI,派 AI 去自动学习,成为这方面的买手,把市场上的 10 万辆摩托车都看完了,选一款是最适合你的,这个任务就完成了」。

陈历飞在介绍自己团队的创业产品 Buysmart.AI时,举了一个很生活化的例子来说明 AI 应用和人类思维的相似性。Buysmart.AI 是一个能理解消费者意图的智能电商购物买手,项目获得了「文心杯」创业大赛的一等奖。

图片[5]-AI下半场,卷完大模型 卷应用-开放智能

陈历飞是一名 90 后,毕业于卡耐基梅隆大学,曾任职于小红书、Meta 和 Pinterest,在广告排名、NLP、个性化推荐领域经验丰富。

在他看来,大语言模型本身就是一个工具,业务还是遵循电商逻辑。Buysmart.AI 参加创业大赛的初衷是提高公司曝光,获取初始资金。在比赛中,文心一言相较于之前使用的 GPT,中文方面更顺畅。「如果我们以后要做国内市场,就需要换成国内的模型。」

另一个核心创始人全 90 后的创业团队,Nolibox,始于 2020 年,也专注于电商营销场景,为电商从业用户打造高品质 AI 平面设计创意生成平台。参加百度的比赛前,公司已服务了一批行业标杆客户,在垂直场景实现了商业化,并获得初心资本的天使轮投资和高瓴创投的 Pre-A 轮投资。

毕业于清华产品设计的主创徐作彪认为,AI 作图,圈外人看热闹,圈内人看实效,SD/MJ(Stable Diffusion/Mid Journey)生成的图尽管很炫,但都是创意图,不是平面设计,两者区别很大,在电商中还不够到直接用的程度。大模型的特长是无限生成,设计师的职责是根据需求产出结果。两者结合,可以降低物料生产成本,但筛选评估还是必然环节。「现在还没有发展到端到端的程度,还不能说颠覆,AI 更像是一个工具,更多是一种助力或者说解锁设计和创意能力」。

陈历飞在美国时也参加黑客马拉松,Nolibox 参加过 GameJam,与强调从 0-1 搭建产品原型的比赛不同,「文心杯」有点像「乐夏」,团队带着项目来,接入大模型,寻找新场景新问题中的解决方法,与百度磨合,探讨两者间长期的合作方式。

本次比赛,还有许多专注于前沿领域的团队项目,如将 AI+ 材料科学结合的「幻量科技」:一个不需要掌握代码,通过语言交互的方式调用最先进的算法的实验和计算平台;面向药企的「生成式 AI 医学内容引擎」——零假设,基于医药领域专门的知识库,为医生和从业者提供信息。

这些团队都基于特定领域的业务模式,经由百度大模型重新寻找「节省时间/人力」的效率点和提高「转化率」的利润点。

大模型与具体应用结合出新,既挖掘出了模型更深的潜力,也帮助孵化出新一代的产品。

03 百度的布局,AI 的中局

这一波的 AI 原生 APP 有一个特点:力图在不改变原来的用户习惯的基础上,解决一些痛点问题,或者找到多个类似小场景叠加有较大的增量价值的场景,定位做 60 分的助手,而非全面替代。比如广为人称道的 Notion AI 具有多场景易用性,适合跑小块程序代码的 copilot 优化了的原来的编程体验。

现在 AI 创业需要实现的是一千一万个小目标,小到找到使用层面的一个个 bug,每一个提示词如何触发相应功能。许多创业者的路径,是大模型语境下,把以前人做的业务重新做一遍。

现阶段成熟的 AI 应用公司,容易吸引资金蜂拥而至。CBInsights 公布的数据显示,截至 2023 年 5 月份,全球共诞生约 13 只 AIGC 独角兽,其中主打营销文案撰写的 Jasper,估值超 15 亿美元,定位图片视频编辑的 Stability.AI,估值超 10 亿美元。

独角兽群里会产生巨头相的公司,长出新的 Google 和苹果吗?现在还不好说。AI 应用的商业化之路漫漫,长夜之中,唯有探索。

经济学家熊彼特的创新理论说,创新性从本质上是不可定义也不可控的;克里斯滕森也将创新描述为代表与过去决裂的、激进、不可预测的突破。他们的论述更多针对工业时代和互联网时代,在 AI 大模型时代,完全从 0 到 1 的创新或许并不存在,或者极为稀少。

当.com 域名被炒上天价时,互联网第一波浪潮也曾在泡沫中破灭。今天的人则更务实,更理性。他们在 AI 面前,探寻其边界。

应用层面渐进、积累式的创新将为下一次爆发作铺垫,应用场景、输出结果、人机交互,都需要大量的微调和测试,这意味着大模型公司和应用层的长期合作。

百度投入了相当多的力气和耐心去做创业比赛,说明它是文心大模型之后的第二波发力点。百度可以通过比赛,收获更多的精准使用者、开发者,推广文心大模型的同时,并收到更多的专业数据、体验的反馈来优化产品。

当然,百度的最终想要实现的,是整个生态繁荣。

自互联网发明以来,科技世界就存在一个悖论式的规律:技术筑起护城河,开放赢得全世界。当一项技术天下无敌,无法复制,而其他人又必须使用时,它的高门槛会为公司赚取利润,同时成为其他竞争者的「成本」。后来者为了与之抗衡,最好的方式是以更低的代价建立一个更开放的生态,邀请更多开发者,把蛋糕做大。

谷歌开放了安卓和 Chrome,苹果开放了 AppStore,成就了众生也成就了自己。百度开放自己的基础设施,为 AI 行业提供水电气,为创业者提供最更适合本土化的语言大模型,也有此意。

文心杯参赛选手普遍对文心大模型有着很高评价。大部分创业者此前用的都是 GPT 等海外大模型,刚开始面对国产大模型时,有些创业者也有顾虑。但在使用几个月后,他们很快适应,并逐渐发现文心的优势。有创业者表示:「我们测试下来的结果,文心和 GPT 的表现差不多。而且从安全、中文兼容性的角度,文心都更好一些」。多位参赛者都坦言感受到了百度的「开放」,在其助力之下找到了应用细分的场景和方向,结识了更多朋友伙伴。

图片[6]-AI下半场,卷完大模型 卷应用-开放智能

打开网易新闻 查看更多图片

ChatGPT 问世时,大模型在自己的向量世界仿佛无所不能、无所不晓,后来我们明白了,这是人类语言在高科技魔镜面前产生的幻觉。AI 面对不熟悉的知识强行编造,同样是一个技术上要解决的幻觉(hallucination)。AI 到了真实世界,与人类事务接触,还得重新活一次。面对特定领域、行业的 know-how 知识、个人,它依然是无知的。大模型诞生至今,还要通过不同的应用,再学一次,学无止境。

2021 年以前,GPT 的训练并不标注论文,输入视频内容不多。随着 AI 多模态能力的增长,应用接入更多,进入的领域越多,数据越多,它的感官和身体才会逐渐发育起来。这次比赛采访中,很多创业者谈到,多模态能力可能是 AI 在未来 5 年最大的突破。多模态中有望涌现出新的智能。

从某种意义上来说,在乔布斯宣布重新发明手机以后,智能手机的竞争才真正开始。AI 革命性的「iPhone 时刻」尚未到来,大模型及其应用的主战场还在不远的未来。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容