又一SOTA级开源模型阶跃多模态百万token不到四毛
又一个SOTA基础模型开源,而且依然是国产。
刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型Step-3正式开源!
在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。【图1】
并且速度飞快,在Hopper GPU上每秒可以解码4039个Token(4K上下文、FP8、无MTP),是DeepSeek-V3的174%。
这一表现,也给大模型解码设定了新的帕累托前沿(资源分配的一种理想状态)。【图2】
另外,Step-3采用了模型-Infra一体化设计,因此性价比也极高。
它有321B参数,但可以运行在8块48GB的GPU上,处理多达80万个token。
如果直观比较,Step-3在H20上的解码成本仅有DeepSeek-V3的30%。
Huggingface工程师评价,这种模型-Infra共同设计的理念,代表了一种前进方向。【图3】