两周复刻DeepSeekOCR两人小团队还原DeepSeekOCR两人小团队，仅

量子位看科技 2025-11-07 20:08:02

两周复刻DeepSeekOCR两人小团队还原DeepSeekOCR

两人小团队，仅用两周就复刻了之前被硅谷夸疯的DeepSeek-OCR？？

复刻版名叫DeepOCR，还原了原版低token高压缩的核心优势，还在关键任务上追上了原版的表现。

完全开源，而且无需依赖大规模的算力集群，在两张H200上就能完成训练。

这一波，彻底让“AI PDF压缩”成为小团队也能玩的事了。

DeepOCR保留了原版的视觉编码核心DeepEncoder构架：

- 第一步：用SAM-base切图，把1024×1024大图变成小块；

- 第二步：卷积压缩token数量，从4096压到256个；

- 第三步：CLIP接手压缩后的tokens，用全局注意力理解语义。

整段视觉处理流程追求的，就是最大化减小token冗余，实现文本→图片→再转文字的“视觉压缩”。

原版用的是参数量大的DeepSeek-3B-MoE做解码，复刻则换成了更常见的Qwen2-7B-Instruct，一来更兼容训练框架，二来全部开源也方便二次开发部署。

替换后的表现也没有显著差距，基础任务上甚至更强，尤其在表格识别这一横竖同步任务上有优越表现。

团队背景也很硬核：一位在清华+普林斯顿主攻多模态视觉，一位是北大物理转计算机方向、现就读爱荷华州立大学，均有Amazon、字节、NVIDIA等一线实习经历。

项目主页：

代码仓库：

0 阅读：17

猜你喜欢

【iOS26.2锁屏界面新增LiquidGlass滑块】iOS26.

【iOS26.2锁屏界面新增LiquidGlass滑块】iOS26.

【1点赞】

ios26 iPhone

程序员特意留的后手bug

程序员特意留的后手bug

【12评论】【16点赞】

程序员

相继亮相的两个人形机器人🤖华为夸父机器人：身高1.66-1.7米，体重45-5

相继亮相的两个人形机器人🤖华为夸父机器人：身高1.66-1.7米，体重45-5

【1评论】【2点赞】

机器人华为人形机器人华为鸿蒙人工智能

发明excel共享聊天的人真是天才

发明excel共享聊天的人真是天才

【1评论】【3点赞】

excel

🙌微软已官宣将于2026年2月开始，在Office套件中彻底移

🙌微软已官宣将于2026年2月开始，在Office套件中彻底移

微软软件

小鹏机器人走路像真人，根本不是靠堆电机！这波“反其道而行之”的操作，才是中国智

小鹏机器人走路像真人，根本不是靠堆电机！这波“反其道而行之”的操作，才是中国智

【114评论】【46点赞】

机器人人工智能

DeepSeek的推理又提速了，这次的关键不是算力堆上去，而是算法更聪明了。百度

DeepSeek的推理又提速了，这次的关键不是算力堆上去，而是算法更聪明了。百度

【2点赞】

算法百度 deepseek

量子位看科技

感谢大家的关注

作者最新文章

1

10门编程语言口碑课学编程优质课程推荐分享10门“有口皆碑”的油管编程课，建议转

2

AI时代信任塌陷AI生成内容正毁掉信任AI生成内容，正在毁掉信任。写内容几乎零成

3

用Python数据分析全球夜店数据分析全球夜生活有趣的数据分析小项目：爬了一整年

4

两周复刻DeepSeekOCR两人小团队还原DeepSeekOCR两人小团队，仅

5

双11电脑遭内存涨价潮AI掀起内存涨价潮双11电脑遭遇内存涨价潮？华强北“一天一

6

何恺明两名新弟子曝光MIT两华人加入何恺明团队AI大牛何恺明的主页，更新了两名新

7

微信AI推翻预测范式清华联手微信革新语言模型大模型一个token一个token生

8

科学家研发广谱蛇毒解药新型抗蛇毒血清源自羊驼在撒哈拉以南非洲，每年约有30万人被

9

AI三大词汇贴切比喻一次弄懂AI三大核心词汇LLM、RAG、AI Agent这三

10

电工机器人征服万伏高压高空高压作业再也不怕在上海宝山区，一台黄色机器人正在13米

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

3

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

华为官宣鸿蒙操作系统610月22日特别发布，官宣更好看，更好用，更智能，更安

6

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

7

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

8

这下你用iPhone的控制中心不会迷茫了。

9

估计不止刘强东和雷军就连马云也发懵了于东来最近这是怎么了，他竟然又说50万元3小

10

HarmonyOS6来了，10月22日14:30，鸿蒙操作系统6

科技最新文章

1

Mate50，60，70，马上80就加入大家庭了，如果说mate50是浴火重生，

2

来看了一下这个机子，说几点1.这个尺寸的机子确实很难得，7英寸，而且比例也很特

3

荣耀500和荣耀500Pro外观设计曝光，大家觉得怎么样？

4

谁能想到！当年诺基亚换电池的快乐，要被iPhone18复刻了？欧盟2027年新规

5

荣耀现在有点不尽人意啊~根据站哥最新发布的数据，各家旗舰的销量差距有点大...

6

华为Mate70Air价格出来了！比iPhoneAir便宜多了！

7

magic8系列一周销量14万，平均一天两万台，还没有上一代magic7系列销量

8

最近关于荣耀500系列的爆料越来越全面，如果这些配置是真的就太棒了！数字系列一

9

Mate70Air：7英寸（2760*1320）120HzOLED等深四曲

10

华为Mate70Air公布今天开启预售之后，价格什么也都公布出来了。汇总一下