【[113星]MiMo-VL:小米推出的强大视觉语言模型,助力复杂推理与多模态任务。亮点:1. 采用原生分辨率ViT编码器,保留精细视觉细节;2. 通过四阶段预训练和混合策略强化学习,性能大幅提升;3. 在多模态推理任务中超越开源基线模型,表现卓越】
'MiMo-VL: A compact yet powerful VLM with extraordinary reasoning potential'
GitHub: github.com/XiaomiMiMo/MiMo-VL
视觉语言模型 多模态推理 强化学习 AI创造营