Date: 2023-05-26
2023年5月25-26日,由广州市科学技术局、亚洲数据集团主办,横琴粤澳深度合作区数链数字金融研究院、珠海横琴万海普罗数字科技有限公司承办的“迈向智能时代,实现文明跃迁——2023AIGC专场峰会”在广州四季酒店隆重举行。本次峰会聚集了来自全球顶尖的人工智能学者、企业家和政策制定者,旨在为人工智能领域的交流与合作搭建高效平台。沐曦研发副总裁黄向军受邀出席峰会并发表演讲。
自ChatGPT爆发以来,大模型技术与产业的迅速发展开启了人类的通用人工智能之旅,其发展速度之快、辐射范围之广、影响程度之深前所未有,正推动生产方式、生活方式和治理方式深刻变革,同时也催生巨大的算力市场需求。大模型发展的背后除了海量数据之外,还需要庞大的智能算力支撑,而智能算力的发展与算力芯片息息相关。沐曦研发副总裁黄向军在主题为《后GPT时代的算力经济学》的演讲中,从GPU芯片从业者的角度探讨大模型时代所面临的算力需求及其背后所包含的算力经济学问题,并分析GPU算力芯片如何应对挑战并实现突破性迭代创新。
黄向军表示,ChatGPT可以说是标志着新工业革命起点的技术产品,以自回归生成式模型为代表的技术路线已毫无争议地占据了人工智能的主流赛道。在后GPT时代,AI开发范式发生变革,初步形成包含预训练模型、指令微调、对齐微调以及应用层(API)开发等多层结构的范式;大模型商业模式也相应发生变化,出现以Foundation模型为底座,加上针对行业应用领域做微调并具备行业Know-How驱动的中间层,去服务大量下游客户的商业生态结构。未来,围绕大语言模型为核心将形成两大市场圈层:一是以大厂或大机构为主导,以少数几个大模型为支撑的通用计算市场;一是基于开源模型,针对私有数据、敏感数据进行大量快速定制和领域对齐的专用定制化市场,相应的技术方案在不远的将来能够快速普及并实现成本下降。
然而,当前我们依然面临着算力短缺以及成本高昂的现状。大模型对算力的巨大需求是传统小模型无法比拟的,其训练和推理成本仍然非常昂贵。对此,从GPU芯片从业者角度,需结合算力成本估算模型提出一些可行优化方向:首先,通过量化、剪枝、蒸馏等模型小型化手段有效降低计算量以降低算力成本;第二,从计算体系结构和软硬件联合优化角度,以类似Flash Attention的高效融合算子技术大幅提高GPU利用率,并发挥GPU生态优势;第三,在GPU芯片以外,通过先进封装、编译优化等技术手段进一步提升芯片上数据的计算效率;最后,针对大模型时代显存不够的问题,GPU+CXL方式是在系统层级提升显存性价比的有效手段。结合整个产业上下游的共同努力,我们有理由相信未来两年大模型应用系统的费效比将会得到数量级的提升。
沐曦作为一家专注于高端GPU芯片及解决方案设计和研发的企业,推出全栈GPU产品,定义了三大产品线:曦思N系列GPU用于AI推理,曦云C系列GPU用于通用计算,以及曦彩G系列GPU用于图形渲染,服务于AI 推理、云游戏和元宇宙等几大场景需求。其中旗舰产品曦云®C500将在2023年下半年实现量产,沐曦也将推出针对大模型推理和训练的完整国产化解决方案,为通用人工智能产业的发展提供强大的算力保障。