小米近日发布并开源了其最新大模型 MiMo-V2-Flash。 该模型采用MoE架构,总参数量为3090亿,活跃参数量150亿,性能对标当前主流开源模型。其核心优势在于极致的推理速度与成本控制,宣称推理速度可达150 tokens/秒,并将成本压至每百万token输入0.1美元、输出0.3美元。

小米近日发布并开源了其最新大模型 MiMo-V2-Flash。 该模型采用MoE架构,总参数量为3090亿,活跃参数量150亿,性能对标当前主流开源模型。其核心优势在于极致的推理速度与成本控制,宣称推理速度可达150 tokens/秒,并将成本压至每百万token输入0.1美元、输出0.3美元。

作者最新文章
热门分类
财经TOP
财经最新文章