【LogicOCR:一个专注于评估大模型在图文场景下逻辑推理能力的基准测试项目。亮点:1. 包含1100道精心设计的多项选择题,覆盖丰富场景;2. 通过自动化流程生成多样化图文样本,确保视觉真实性和上下文相关性;3. 提供详细的评估工具和结果分析,助力模型优化】
'LogicOCR: Do Your Large Multimodal Models Excel at Logical Reasoning on Text-Rich Images?'
GitHub: github.com/MiliLab/LogicOCR
逻辑推理 多模态模型 基准测试 AI创造营