【[41星]SeekWorld:首次尝试复现o3类视觉线索追踪推理能力,助力多模态大语言模型提升视觉推理性能。亮点:1. 提供50个详细视觉线索追踪推理过程样本,助力模型学习;2. 数据集覆盖全球多样化场景,提升模型泛化能力;3. 采用强化学习训练,模型性能显著提升】
'SeekWorld: Geolocation is a Natural RL Task for o3-like Visual Clue-Tracking Reasoning'
GitHub: github.com/TheEighthDay/SeekWorld
多模态模型 视觉推理 强化学习 AI创造营