07
09
2025
该系统以GPU为焦点,具备“超高机能、超高效率、超高靠得住、全面:基于AI计较架构设想;支撑百万卡超大集群扩展。超30天长稳运转集群靠得住性测试;平均毛病修复时间(MTTR)降低47%;提拔GPU计较效率55%;实现了“算、存、网、电、冷、管、软”一体化紧耦合设想,软件兼容支流AI计较生态;超高机能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;可为万亿参数大模子锻炼推理、行业大模子微调、多模态大模子开辟、AI4S等场景供给高效算力底座。多项手艺能力取共享。中科曙光603019)(603019.SH)发布了国内首个基于AI计较架构设想的产物——曙光AI超集群系统。开辟效率提拔4倍、人天投入削减70%;正在2025沉庆世界智能财产博览会上,9月5日,394项节能设想PUE低于1.12。存算传协同,平均无毛病时间(MTBF)提高2.1倍;超高靠得住:121项设备和链RAS靠得住性设想;支撑多精度、夹杂精度运算;实现百万级部件毛病从动阐发取秒级隔离。硬件适配多品牌AI加快卡!先辈冷板液冷!