华为揭秘盘古大模型3.0:“不作诗,只做事”

华为揭秘盘古大模型3.0:“不作诗,只做事”

作者 | 程潇熠

编辑 | 康晓

出品 | 深网·腾讯小满工作室

“华为的盘古大模型不作诗,只做事。”华为常务董事、华为云CEO张平安在华为开发者大会2023上称,AI技术从多分支发展进入大模型时代,今年全球已发布百个大模型,中国发布超80个大模型,这些大模型的共性是基本都会“对话作诗”,而华为大模型要在行业领域赋予价值。

7月7日,华为发布盘古大模型3.0,推出昇腾AI云服务。据华为介绍,昇腾AI云服务千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。除了支持华为的AI框架Mindspore外,还支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,均可通过华为的迁移工具从GPU平滑迁移到昇腾。

华为在此轮人工智能浪潮中的思考是,要全力推进人工智能“走深向实”。昨日,华为轮值董事长胡厚崑在2023世界人工智能大会上称,2022年底ChatGPT的出现,将人工智能推向新风口,人工智能将帮助人类改写身边的一切。“走深向实”则是华为的重要战略。

如何“走深向实”?华为认为一方面是深耕算力,打造强有力的算力底座以支撑中国人工智能事业发展。另一方面,结合大模型,从通用大模型到行业大模型的研究创新,让人工智能能真正服务好千行百业、科学研究。

胡厚崑透露,目前华为云生态已孵化了20多个基础的大模型,同时还适配了10多个业界主流的大模型。另外,华为云盘古大模型已经深入金融、制造、政务、电力、煤矿、医疗、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

“我们非常有幸共同见证了科技革命的几次浪潮,从互联网到移动互联网,再到云计算,到人工智能,每一轮的变革都给社会带来了深远的影响。毫无疑问,站在今天,通用人工智能正给我们无穷的想象空间,也正带领我们走进下一个黄金的10年。”胡厚崑称。

盘古大模型三步走

盘古大模型从2020年启动研发,2021年4月正式发布,再到2022年进行行业应用落地,华为将其进化路径可分为L0-L1-L2三个阶段。

盘古大模型L0至L2路径示意图 来源:国金证券研究所

L0阶段为基础大模型阶段,包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型以及Graph(图网络)大模型等。

其中,基于提示调优、动态冰化等一系列正则化技术,NLP大模型已实现小样本学习任务超越GPT系列。

L1阶段为行业大模型阶段,指在L0基础上导入行业数据进行训练后衍生出的模型,如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。

目前,华为云盘古大模型已经进入金融、制造、政务、电力、煤矿、医疗、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

在科学领域,气象大模型、药物分子大模型已有成果。今年6月,华为云盘古气象大模型研究成果在国际学术期刊《Nature》正刊发表,据称为近年来首篇以中国科技公司作为唯一署名单位发表的《Nature》正刊论文(华为云独作)。

《Nature》审稿人评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来。”

据介绍,华为盘古气象大模型是首个精度超过传统数值预报方法的AI模型,能够提供秒级全球气象预报,预测速度提高10000倍以上,台风轨迹预测准确度世界第一,台风生成时间与移动轨迹预测的预测准确率超过85%。相比欧洲气象局提升约20%。

盘古提前10天预测台风玛娃的路径、提早预测寒潮

另外,官方称,盘古科学大模型还打破了医药界的“双十定律”, 即一款新药从研发到上市,平均需要10年时间和10亿美元的投入。而西安交通大学第一附属医院利用盘古药物分子大模型设计出的全新的广谱抗菌药物Drug X,让先导药的研发周期 从数年缩短至一个月,研发成本降低70%。

L2是指在L1基础上结合行业细分场景得到的推理模型。比如,在盘古矿山大模型、盘古电力大模型、盘古制造质检大模型等L1行业模型的基础上,针对其中细分具体任务,如偏光片质检、电力巡检、铁路 TFDS 检测、传送带异物检测等,通过“预训练+微调”得出L2细分场景模型。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容