新闻

开yun体育网AI集群可费用进步30%  跟着AI集群限制的扩大-开云·kaiyun(中国)体育官方网站 登录入口

         发布日期:2024-11-20 05:14    点击次数:108

开yun体育网AI集群可费用进步30%  跟着AI集群限制的扩大-开云·kaiyun(中国)体育官方网站 登录入口

  11月12日,中国东谈主工智能产业定约第十三次全会在北京召开,华为数据存储调治中国信通院、工信部东谈主工智能关节工夫和应用评测现实室、工商银行、中国迁徙(600941)、中国联通、百度、阿里云、腾讯云、蚂辘集团等认真发起“大模子基础法子高质地发展行径经营”,该经营从需求角度开赴,以进步大模子基础法子的质地与效用为见识,共同加速布局“高效筹划调遣+高性能AI存储+高通量麇集+高效用设立平台+智能化运维平台”,助力大模子工程化落地。

  华为闪存存储边界总裁黄涛参与驱动庆典,并行动鼓励经营代表发表《构建先进AI存储,助力AI大模子高质地发展》主题演讲。

  东谈主类诓骗数据在AI边界取得长足发展,数智时期是数据的黄金时期,跟着数据限制爆炸式增长、数据价值握住攀升,但同期咱们面对xPU与存储的带宽不及、算力集群可费用低、推理时延迟等挑战,这对存储淡薄更高要求。黄涛淡薄,具备极致性能、高膨胀性、数据韧性、可执续发展、新数据范式以及数据编织才智的新一代AI存储是通往AI数智时期的必由之路。

  以存强算,AI集群可费用进步30%

  跟着AI集群限制的扩大,故障率也随之变高,当今业界千卡以上的AI集群可费用频频不及50%,这意味着,即使咱们握住增多xPU的数目,其可费用却呈反比抵制,这关于资本腾贵的AI集群来说是极大的资源花费,而进步磨真金不怕火集群存储性能不错大幅裁汰数据集加载时期,达成秒级CKPT(检讨点)保存,分钟级断点续训,灵验进步算力集群可费用。

  数据编织,达成跨域数据高效归集,数据全局可视可管

  跟着大模子的限制规定(Scaling Law)握住演进,岂论是在进行CKPT的并行保存与加载、多模态数据的收罗与清洗、全局数据的Shuffle(混洗)与模态对都,如故AI算法的调优以及大限制集群的运维会诊追踪,都紧要需要一个全局平等分享、单一定名空间、且具备高性能并行读写才智的大型文献系统。这么的系统或者幸免多文献系统和多集群之间联邦式的低效堆叠,从而权贵简化大限制集群环境下的数据调遣和数据管制进程,进而执续提高数据供应的恶果。

  以存代算,长顾虑内存型存储进步推理体验并抵制系统资本

  AI推理是企业达成AI应用买卖化的先决条款,长高下文处理工夫不仅权贵进步了模子在万般化任务中的发扬,况兼为模子在内容应用中的无为应用打下了坚实的基础。彰着,Long Context(长高下文)处理工夫依然成为推理工夫将来发展的主要趋势。但是,在内容应用中,长高下文处理面对着资本腾贵和体验欠安的双重挑战,尤其是在推理过程中KV-Cache存不下问题尤为隆起。紧要需要处理KV-Cache的全局分享和推理顾虑的执久化问题。因此,将KV-Cache达成分层缓存,并确保其高性能打听,通过长顾虑内存型存储以存代替算来进步推感性能和资本效益,已成为工夫发展的主流地方。

  中国的AI存储快速发展,华为与清华MADSys调治的存储决议,在24岁首次获取MLPerf Storage测试群众第一,2节点AI存储性能高达679 GB/s,性能方针达到第二名的2倍,在单元空间内不错提供更多的性能。

  存储系统存在于大模子生命周期的每一环开yun体育网,是大模子的关节基座,先进AI存储或者进步磨真金不怕火集群可费用,保险数据安全,抵制推理资本进步用户体验。黄涛暗意,在数据的黄金时期需要AI原生涯储,产学研用需要加强互助引颈AI原生涯储发展地方,助力AI大模子高质地发展。



 
友情链接:

Powered by 开云·kaiyun(中国)体育官方网站 登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024