正文内容 评论(0)
2024年12月26日,经工信部指导、由中国电子技术标准化研究院主办的2024云计算产业和标准应用大会在北京举行。本次大会以“云承百业促发展 智引标准启新程”为主题,汇集政产学研用各方专家学者,共同探讨云计算产业发展方向和未来机遇,展示云计算标准化工作重要成果。会上,百度智能云荣获2024年度云计算标准化优秀成员单位及2024年度全国信标委云计算标准工作组优秀专题组单位,并成功当选“智能云服务标准工作组”组长单位。
大会还公布了《信息技术 云计算 智能云服务通用要求》测评结果,百度智能云百舸异构计算平台(以下简称百舸平台),百度智能云千帆大模型平台(以下简称千帆平台)、百度专有云ABC Stack平台(以下简称ABC Stack)顺利通过测评。
大会最后,百度集团产品委员会联席主席宋飞作为企业代表,分享了大模型时代云计算发展的新趋势与新动态。
从极致弹性到极致规模:大模型时代的基础设施升级
谈及大模型时代对基础设施的需求时,宋飞表示,大模型技术的兴起引领了计算范式的深刻变革。在以 CPU 为核心的通用计算时代,计算主要依赖通用服务器,追求极致的弹性和性价比。而在大模型时代,随着模型参数规模的快速增长,算力需求呈现爆发式提升。这不仅要求企业持续提升单服务器的计算密度,还需通过高效互联构建大规模集群。目前,大模型已进入十万卡规模的集群阶段,对企业在运营、调度、机房和网络等多个方面提出了高要求。企业亟需构建具备极致高密、极致互联和极致规模特性的基础设施。
宋飞指出,构建极致规模的基础设施首先需要解决算力供应问题。在国内环境下,采购英伟达的GPU常受多重限制,“一云多芯”是必然选择。而如何在算力受限的情况下,把有限的卡聚合起来,充分利用是关键所在。目前,通过一系列优化手段,在万卡集群上,百舸已实现95%以上的多芯混合训练效能。
在解决了算力供给问题后,如何确保大模型训练的稳定性同样至关重要。稳定运行要求快速发现和定位故障,尽量减少任务中断时间甚至实现不中断运行。针对这一挑战,百舸平台对模型训练的稳定性进行了全面优化。平台具备强大的故障诊断能力,能够快速自动检测导致训练异常的节点故障,同时提供自动化容错功能,将任务重新调度至健康节点,确保训练顺利进行。
“目前,百舸平台已实现万卡集群99.5%以上的有效训练时长,在业内处于领先水平。”宋飞说。
从繁琐到高效:大模型改变AI应用落地范式
传统AI应用落地时,需要针对不同的细分场景训练专属模型,涉及数据准备、模型训练和场景开发等复杂流程,效率低下且容易产生碎片化问题。大模型时代的到来,通过利用大模型的泛化能力,只需适量的行业数据或精调处理,即可显著提升效率,降低开发门槛与成本。
百度智能云AI与大模型平台副总经理施恩表示,目前企业通过大模型进行AI应用落地的路径有三种:一种选择是直接调用模型,也就是模型推理;第二种是模型应用效果优化,包含了提示词优化、模型精调以及模型能力增强;第三种则是大模型应用开发。在这一过程中,千帆平台从模型开发、模型服务到应用开发,为企业提供全流程支持,打通了大模型落地应用的“最后一公里”。
模型调用方面,千帆ModelBuilder提供包括文心全系列模型在内的丰富模型,其中ERNIE 4.0 Turbo等旗舰模型适用于通用的复杂场景;ERNIE Speed Pro、ERINIE Lite Pro等主力模型,适用于垂直场景定制训练或构建行业模型;此外,还有轻量级、垂直场景模型,分别适用于特定垂直场景调用。
模型应用效果优化方面,千帆ModelBuilder通过准确简练、逻辑详尽的提示词,以及提供模型精调全流程工具链,帮助企业快速实现效果调优。为激发大模型推理效果,千帆ModelBuilder还预置了近300个行业场景的prompt模版以及模型精调样板间,提供了多场景模型精调工具链,并通过模型蒸馏、数据飞轮等工具,帮助企业实现模型精调快速冷启,持续提升模型及应用效果。
针对应用开发,千帆AppBuilder为提供企业级大模型应用开发平台,不仅满足企业级Agent的开发、企业级集成和安全部署,另外沉淀了工业、政务、能源等6大行业应用开发解决方案。通过千帆AppBuilder,用户可以生成具有自主规划能力的Agent,支持用户自定义创建组件,并被Agent自动编排调用。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...