DeepSeek新模型为何被夸爆DeepSeek这次的OCR新模型,可能真打开了AI的新思路。传统语言模型读长文本像逐字抄经,费算力又慢;而DeepSeek反其道而行把长文本变成图像,再让AI去看图识字。结果不仅省算力,还把精度拉到97%,一张A100能处理20万页文档。
感觉这个模型特别适合用来处理旧杂志、扫描文档、混合排版内容的数字化。传统OCR输出的是混乱的文本,需要大量手工清理,而这个模型能直接输出结构化的Markdown,大大减少后期处理的工作量。
DeepSeek新模型为何被夸爆DeepSeek这次的OCR新模型,可能真打开了AI的新思路。传统语言模型读长文本像逐字抄经,费算力又慢;而DeepSeek反其道而行把长文本变成图像,再让AI去看图识字。结果不仅省算力,还把精度拉到97%,一张A100能处理20万页文档。
感觉这个模型特别适合用来处理旧杂志、扫描文档、混合排版内容的数字化。传统OCR输出的是混乱的文本,需要大量手工清理,而这个模型能直接输出结构化的Markdown,大大减少后期处理的工作量。
作者最新文章
热门分类
科技TOP
科技最新文章