开云体育
DeepSeek发布新模开云APP下载型寒武纪、华为快速适配!国产算力产业链崛起
根据DeepSeek同步公开的论文,所谓的稀疏注意力机制,是在混合注意力架构(MLA)基础之上,用稀疏注意力机制来替代密集注意力,实现先筛选再计算,进而可以提升长文本理解能力。DSA引入了组件闪电索引器,可以判断出哪些历史token相对于当前token更加关键,然后选择这些关键token进行计算。这就带来核心注意力计算难度的大幅下降,从而极大提升了长文本的处理效率。
受益于新模型成本的下降,DeepSeek再次大幅下调API价格,成本将下降超50%。输入成本降幅达到50%-60%,缓存命中时价格为0.2元/百万tokens(下降60%),缓存未命中时价格为2元/百万tokens(下降50%)。输出价格为3元/百万tokens,较之前大幅下降75%。
根据寒武纪开发者的信息,9月29日寒武纪已经实现适配DeepSeek-V3.2-Exp模型,并开源大模型推理引擎vLLM-MLU源代码。寒武纪还表示,公司一直重视芯片与算法的联合创新,对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。
在国产算力产业链携手发展的背景下,我国算力产业链规模快速增长。 截至今年上半年,我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线 EB,全国算力中心平均电能利用效率(PUE)降至1.42,算力基础设施规模和水平不断提升。