关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻62人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

股价暴涨!又一超级风口来了?

财经锐眼 浏览 15

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 61

零跑业绩向好 朱江明持股增加

汽势传媒 浏览 51

财经调查丨红木商家偷梁换柱,一套沙发多赚1万元!

央视财经 浏览 67

财经调查丨一张红木床差价27000元!央视曝光红木市场销售乱象→

央视财经 浏览 79

德约回应针对他受伤的新闻:媒体总爱断章取义

网球之家 浏览 20

财经调查丨血檀变“小叶紫檀”!央视曝光红木制品证书按斤卖→

央视财经 浏览 69

第六代RAV4荣放双擎精英版上市限时焕新价15.18万元

网易汽车 浏览 10

网友称有人戴恐怖面具故意惊吓高速车辆 知情人士发声

扬子晚报 浏览 84

点啥啥火,天风美女首席“吓得”散群!那些强得可怕的分析师们

深蓝财经 浏览 74

电动车宣称功能永久免费用后却要求付费升级 官方立案

扬子晚报 浏览 7

产地造假、证书批发...总台《财经调查》揭秘红木市场销售的“障眼法”→

央视财经 浏览 66

渔民多次捞到"间谍鱼":起网看到球形物 上面有外国字

环球网资讯 浏览 72

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 22

破解先进封装与数字测试双重挑战 爱德万测试亮相西门子EDA Forum

爱集微 浏览 76

直击科大讯飞业绩会!董事长刘庆峰:希望提到学习机,用户想到的就是科大讯飞

时代周报 浏览 68

记者:拓王之战转播源取自现场大屏,所以直播视角混乱+回放过多

懂球帝 浏览 54

特朗普亮明"弃台"主张 学者:美在台海已不具军事优势

台海网 浏览 20

落马官员受贿细节:行贿者把装198万现金拉杆箱放车里

红星新闻 浏览 80

第三代UNI-V正式上市 指导价10.29-11.99万元

网易汽车 浏览 87

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 63
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12