高端高速网络长期被海外垄断的局面,终于迎来国产力量的突围。3月12日,中科曙光在郑州推出全栈自研400G无损高速网络scaleFabric,从底层112G SerDes IP、网卡与交换核心芯片,到网卡、交换机硬件,再到上层驱动、管理软件,实现100%自主研发,成为国内首款原生RDMA高速网络系统。 这一步,打破了国外高端高速网络的长期垄断,更让中国智算基础设施有了真正的“中国心”。
长久以来,全球高端高速网络产业链被海外主导——2019年英伟达收购主打InfiniBand技术的Mellanox后,进一步掌控了高速网络的核心话语权。 国内用户使用IB网络时,不仅面临技术垄断的痛点,成本、服务响应速度也难以满足需求。而随着AI大模型迈入万亿参数时代,万卡级智算集群对低时延、高带宽、全程无损的网络需求愈发迫切,传统以太网或依赖复杂调优的RoCE网络已无法支撑,自主可控的原生RDMA网络成为必须补上的短板。 scaleFabric的核心竞争力,藏在两颗自主研发的高速网络芯片里:网卡芯片支持400G高带宽,搭载自研RDMA引擎,端到端RDMA时延低至0.93微秒;交换芯片实现64T双向交换容量,采用VCT架构,转发时延仅260纳秒。 性能上,它全面对标甚至超越国际主流NDR产品——交换机端口密度达80口400G,比传统64口方案提升25%,大幅降低组网成本;单卡最大QP数支持256K,是常规方案的两倍,更好支撑大规模并行计算;单子网最大可支持11.4万卡集群部署,扩展能力提升2.33倍;整体组网成本下降30%,兼顾了高性能与普惠性。
实测数据更印证了实力。中国科学院计算技术研究所研究员王展作为首批用户,将scaleFabric与英伟达CX7网卡做头对头测试,结果单QP通信性能比CX7更优,RDMA write和send延迟最好成绩能做到1.14微秒和1.47微秒。 王展说,数据比英伟达还要好一点。这些数字不是纸面的标榜,而是真正的世界级水准——中国人花了三年时间,把从112G高速SerDes IP到400G网卡芯片、64G交换芯片的硬骨头全啃了下来,在核心性能上直接对标甚至超越国际巨头。
产品不仅技术过关,更实现了量产落地。scaleFabric已在国家超算互联网位于郑州的核心节点完成万卡级集群部署,支撑三套万卡级scaleX智算集群正式上线,总规模达3万卡,网络部署仅用时36小时。
从被海外垄断到全栈自研,从性能追赶至部分超越,中科曙光scaleFabric的发布,不是简单的“能用”,而是“好用”甚至“更优”的突破。 这不是在别人的赛道上跟随,而是在英伟达最深的护城河里,硬生生填出了一条属于中国的路。它补上了中国智算的最后一块短板,把高速网络的心脏彻底换成了中国心,更让市场看到——自主可控的技术底座,正在成为中国数字经济高质量发展的坚实支撑。




