美团的大模型也来了[哆啦A梦吃惊]
LongCat-Flash,总参数量达 560B,采用了创新的动态计算机制 MoE 架构,能根据上下文需求激活 18.6 B 至 31.3 B 的参数(平均约 27B)。
美团的大模型也来了[哆啦A梦吃惊]
LongCat-Flash,总参数量达 560B,采用了创新的动态计算机制 MoE 架构,能根据上下文需求激活 18.6 B 至 31.3 B 的参数(平均约 27B)。
猜你喜欢
【16评论】【2点赞】
【8评论】【5点赞】
【18评论】【4点赞】
【77评论】【66点赞】
【36评论】【11点赞】
【24评论】【3点赞】
【1点赞】
【79评论】【40点赞】
作者最新文章
热门分类
科技TOP
科技最新文章