DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限--快科技--科技改变未来

正文内容 评论（0）

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

2025-10-21 07:53:53 出处：快科技作者：鹿角编辑：鹿角评论(0)

复制

纠错

#DeepSeek #模型

快科技10月21日消息，据媒体报道，DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍，DeepSeek-OCR的参数量约为3B，是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成：DeepEncoder能够在高分辨率输入条件下保持低激活状态，实现高压缩比并生成适量的视觉token；解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示，当文本token数量控制在视觉token的10倍以内（压缩率<10 x ）时，OCR识别精度可达97%；即使压缩率提升至20×，模型准确率仍能维持在60%左右。

研究团队表示，这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

论文标题：DeepSeek-OCR: Contexts Optical Compression

项目地址：https://github.com/deepseek-ai/DeepSeek-OCR

论文地址：https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-OCR

【本文结束】如需转载请务必注明出处：快科技

责任编辑：鹿角

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#DeepSeek #模型 #开源

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波