【LogicOCR：一个专注于评估大模型在图文场景下逻辑推理能力的基准测试项目。

爱生活爱珂珂 2025-05-20 14:00:30

【LogicOCR：一个专注于评估大模型在图文场景下逻辑推理能力的基准测试项目。亮点：1. 包含1100道精心设计的多项选择题，覆盖丰富场景；2. 通过自动化流程生成多样化图文样本，确保视觉真实性和上下文相关性；3. 提供详细的评估工具和结果分析，助力模型优化】

'LogicOCR: Do Your Large Multimodal Models Excel at Logical Reasoning on Text-Rich Images?'

GitHub: github.com/MiliLab/LogicOCR

逻辑推理多模态模型基准测试 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【LogicOCR：一个专注于评估大模型在图文场景下逻辑推理能力的基准测试项目。

2

【[65星]dexterity-aha-guide：从零到掌握通用灵巧手的全方位

3

【[61星]verl-agent：为LLM/VLM Agent训练提供高效的强化

4

【[57星]Voice_Extractor：从多说话人的音频中提取目标说话人的语

5

【[160星]Magentic-UI：微软推出的人性化网页Agent，让复杂的网

6

【[1.5k星]microsoft/edit：致敬经典MS-DOS编辑器的现代文

7

微软宣布将VS Code转型为开源AI代码编辑器（锐评见长图）微软在2025年B

8

NVIDIA发布物理AI、机器人和国家级AI工厂发展路线图（锐评见长图）围绕着将

9

微软：“万物皆可Agent，一切皆为Agent”（附锐评见长图）微软在Build

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

目前接近完美的6部手机，有你在用的嘛？

2

华为自研鸿蒙电脑，没有键盘！是一整块可折叠的超大屏幕，然后内置大面积线性马达，通

3

这中控屏幕看起来有点丑

4

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

5

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

6

字节的工资是真的高啊！

7

华为又整出了非凡大师鸿蒙电脑。这又开创了一种电脑新型态，折叠电脑，而且还是纯

8

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

9

美国最近突然宣布，不准全球任何公司用华为的昇腾芯片！想用必须先问美国同意。这一下

10

刚刚！#一加13T#首销10分钟破两亿！这手机我也用了几天，最大的感受是真爽，单

科技最新文章

1

一加Ace5至尊系列官宣5月27日发布，竞速版搭载天玑9400e处理器，至尊版搭

2

一加手机设计不套娃了，上回13T是一个样，现在Ace5至尊又另一个样。至于金色机

3

我问我老公:小米花135亿就造出了3纳米芯片，是真的吗？老公斜我一眼:如果从

4

华为牛气冲天啊！直接甩出两款鸿蒙电脑，一个比一个炸裂，MateBookPro起

5

5月19日下午五点前，刚刚发生的最新消息！第一、就在刚刚！5月19日，华为在

6

第一时间拿到，华为Nova14Pro，手感很棒，非常精致，全系支持国补[捂脸

7

华为nova1412+256GB2699元12+512GB2999元12+5

8

华为是真有想法，这个手机壳估计会火。手机壳上有个电子墨水屏，用NFC供电，可以

9

华为发布会华为nova14Ultra产品力好强，三颗镜头都是RYYB

10

【Siri升级迟迟未到，消息称苹果AI投入犹豫不决、后续功能不再“画大饼”】在