开云体育
开云APP下载DeepSeek团队发布新型视觉压缩模型DpSk-OCR
智通财经APP获悉,10月20日,DeepSeek-AI团队推出全新研究成果——DeepSeek-OCR,提出通过视觉模态压缩长文本上下文的创新方法,即是把长长的上下文渲染成一张图片再喂给模型,让原本需要数千上万个文本token的上下文,只需几百个视觉token就能表示,实现信息的高效压缩。
据悉,DeepSeek-OCR由两个部分组成:核心编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M。DeepEncoder专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉token数量在可管理的范围内。
实验显示,当文本token数量不超过视觉token的10倍(压缩比低于10x)时,模型的OCR(文字识别)精度可达97%;即便压缩比提高到20x,准确率仍保持约60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR同时具备较高的实际应用价值。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
医护人员工资“稳了”!官方出手:年底前全国所有统筹区均需开展!医院回款全面提速
NASA急了,登月不用星舰?马斯克:记住我的线名中国用户举报苹果:中外双标,滥用支配地位
北方大面积降温上热搜!华润置地出手,在三亚CBD重塑热带度假人居格局!
青岛市小初英语“贯通教学”能力提升培训在青岛中央商务区实验学校成功举办
苹果股价站上新高 iPhone17“技术普惠”点燃换机潮 这些公司“实锤”进入供应链