【[113星]MiMo-VL:小米推出的强大视觉语言模型,助力复杂推理与多模态任

爱生活爱珂珂 2025-05-31 19:24:33

【[113星]MiMo-VL:小米推出的强大视觉语言模型,助力复杂推理与多模态任务。亮点:1. 采用原生分辨率ViT编码器,保留精细视觉细节;2. 通过四阶段预训练和混合策略强化学习,性能大幅提升;3. 在多模态推理任务中超越开源基线模型,表现卓越】

'MiMo-VL: A compact yet powerful VLM with extraordinary reasoning potential'

GitHub: github.com/XiaomiMiMo/MiMo-VL

视觉语言模型 多模态推理 强化学习 AI创造营

0 阅读:1
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注