Z6官网

华为版ChatGPT将于7月7日颁布

6月4日新闻,据钛媒体,华为公司将颁布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat” 。

据介绍,盘古大模型于2020年11月在华为云内部立项成功 。这款“盘古Chat”预计将于今年7月7日进行的华为云开发者大会(HDC.Cloud 2023)上对表颁布以及内测,产品重要面向To B/G政企端客户 。

凭据华为颁布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发 。整体来看,PanGu-Σ大模型在对话方面可能已靠近GPT-3.5的水平 。

华为版ChatGPT,7月7日颁布

公开资料显示,华为盘古大模型于2021年4月正式对表颁布,后来又在2022年4月升级到2.0版本 。目前,AI大模型中的NLP大模型、CV大模型以及科学推算大模型(形象大模型)均已被象征为即将上线状态 。

据介绍,这是首个千亿参数中文预训练大模型,CV大模型则初次达到30亿参数 。盘古CV大模型业界最大CV大模型、初次实现两全判断与天生能力、在ImageNet上幼样本进建能力上的业界第一;盘古形象大模型提供秒级气象预报;紫东.太初是全球首个图、文、音三模态大模型 。

对于盘古大模型定位,华为内部团队确立了三项最关键的主题设计准则:一是模型要大,能够吸收海量数据;二是网络结构要强,可能真正阐扬出模型的机能;三是要拥有优良的泛化能力,能够真正落地到各行各业的工作场景 。

凭据华为云高管的演讲PPT信息,目前华为“盘古系列AI大模型”基础层重要蕴含NLP大模型、CV大模型、以及科学推算大模型等,上层则是与合作同伴开发的华为行业大模型 。

华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学推算大模型等多个大模型组成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规;⒉祷烟,能够支持多种天然说话处置工作,蕴含文本天生、文本分类、问答系统等等 。

具体来看,盘古NLP大模型初次使用Encoder-Decoder架构,两全NLP大模型的理解能力和天生能力,保障了模型在分歧系统中的嵌入矫捷性 。下游利用中,仅需少量样本和可进建参数即可实现千亿规模大模型的急剧微和谐下游适配,这一模型在智能舆论以及智能营销方面都有不错的阐发 。

盘古NLP大模型

盘古NLP大模型

盘古CV大模型是初次实现模型按需抽取的业界最大CV大模型,初次实现两全判断与天生能力,基于模型大幼和运行速度需要,自适应抽取分歧规模模型,AI利用开发急剧落地 。使用档次化语义对齐和语义调整算法,在浅层特点上获得了更好的可分离性,使幼样本进建的能力获得了显著提升,达到业界第一,这一模型在智能巡检以及智慧物流方面有不错的阐发 。

盘古CV大模型

盘古CV大模型

盘古形象大模型提供秒级气象预报,借助创新的3DEST网络结构以及分层功夫聚合算法,在形象预报的关键身分和常用功夫领域上精度均超过当前最先进的预报步骤,速度相比传统步骤提升1000倍以上 。同时,盘古形象大模型支持宽泛的下游预报规划,如在台风蹊径预测工作上,相比传统数值形象预报步骤,盘古形象大模型能够降低20%以上的地位误差 。

盘古形象大模型

盘古形象大模型

浙商证券此前披露的信息显示,华为在训练千亿参数的盘古大模型时挪用了超过2000块的昇腾910芯片,进行了超2个月的数据训练能力 ;诓砍,每年大模型训练挪用GPU/TPU卡超过4000片,3年的大模型算力成本高达9.6亿元人民币 。

东吴证券梳理的华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储蓄和算力自主可控,有望成为国内当先的大模型,其生态产业链标的有望迎来加快发展,蕴含拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司 。国盛证券则以为,华为盘古为首个多模态千亿级大模型,有望赋能百业 。

▲图源:东吴证券

▲图源:东吴证券

华为云

华为云

 

联系Z6官网

Z6官网以建设成为全国当先的新型产业赋能平台为愿景,先后荣获高新技术企业、皖企登云第一批推荐云平台、岳阳市优良招商照拂等荣誉 。

高品质服务团队 多对一为您服务:

首页- Z6官网中国区人生就是博

联系Z6官网

联系Z6官网

0551-62586667
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部
【网站地图】