开云体育
开云体育官方DeepSeek新模型这次真玩大了
你可能会想,不就是个OCR吗?它能把图片里的文字识别出来,市面上一大堆,有啥稀奇的。
但如果我告诉你,它真正的目标,根本不是这个,而是要彻底改变AI处理信息的方式。
想聊清楚这事儿吧,咱得从当前 AI 面临的最大挑战说起:长上下文处理的算力瓶颈。
现在的AI处理文字,只能一个字一个字的读,读得越多,脑子越累。你给AI输入的文字越多,它需要的计算量是呈指数级暴涨的。
大家都在卷这个,但DeepSeek想了个骚操作。既然一个字一个字读太累,那为何不直接把整页纸拍张照片,让AI看图不就完了?
来,我给你算笔账。一张图片有大概10000个单词,如果按传统方式,AI要把这10000个字一个个处理,需要10000多个token。
但如果把这些字渲染成图片呢?只需要几百个视觉token,你可以简单理解成几百个像素集合。
更恐怖的是,用单张A100显卡一天能处理20万页文档。别忘了毕竟咱还有个标签,叫价格屠夫。
人类的记忆是有层次的,刚发生的事跟几年前的事,记忆程度肯定不一样,这受大脑的运作方式决定,会把有限的资源分配给最重要的信息。
连AI大神Andrej Karpathy都被震撼了,他说也许像素才是比文字更好的AI输入方式。
而且,完全没必要担心会丢失信息。毕竟有选择性的遗忘,比无差别的记忆更重要。相比婚礼誓言,前天早餐吃的啥没有必要被记住。
听起来,也是非常符合直觉的。也许几年后,所有AI都会先把输入渲染成图像,再进行处理。
那时候我们才恍然大悟,原来DeepSeek当时扔出的这个,看似平平无奇的OCR模型。


2025-10-23
浏览次数:
次
返回列表