分享好友 资讯首页 资讯分类 切换频道

北大与DeepSeek联合开源DSpark框架 提升大模型推理效率

2026-06-27 22:51110两砚网搜狐网

今日,DeepSeek 联合北京大学发布了DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率问题。该框架已应用于DeepSeek-V4-Flash和DeepSeek-V4-Pro的预览版服务引擎中,在同等吞吐量水平下,单用户生成速度提升了60%至85%。相关论文、训练代码等已在GitHub上开源。

大语言模型生成文本时采用自回归方式,每生成一个新token都需要一次完整的前向传播,这导致推理延迟随输出长度线性增长。推测解码技术通过一个小模型快速生成候选token,再由大模型批量验证,从而提升生成速度。然而,推测解码的实际加速效果受制于候选生成质量和验证阶段对目标模型计算资源的占用。

目前主流方案分为两派:自回归式草稿模型逐token串行生成候选序列,依赖关系建模能力强但生成延迟随候选长度线性增长;并行式草稿模型则在一个前向传播内一次性产出全部候选token,生成延迟几乎与候选长度无关。但并行生成每个位置时无法依赖先前已采样的token,导致接受率迅速衰减,浪费目标模型计算资源。

为解决上述瓶颈,DSpark提出了两项互补机制。在候选生成阶段,DSpark采用半自回归架构,主干网络一次性产出所有候选位置的隐藏状态和基础logits,随后轻量级顺序模块逐token注入前缀依赖信息。实验表明,少量自回归依赖的引入在参数效率上优于单纯堆叠并行层。

收藏 0
打赏 0
曾爆火的“拉面哥”再开实体面馆 与“大衣哥”完成五年之约
6月27日,曾在网上爆红的“拉面哥”程运付与家人在山东省临沂市兰陵县新开了一家拉面店。面馆开业当天,“大衣哥”朱之文特意前往店里祝贺,实现了两人五年前的约定。程运付透露,面馆一周前刚刚开业

0评论2026-06-2811

“毒纸尿裤事件”记者回应调查过程 多方声音交织引发关注
6月18日,《经济参考报》发布调查报道,称多名消费者反馈家中婴幼儿使用部分品牌纸尿裤后出现反复红臀、皮肤红肿破溃等问题,停用后症状明显缓解

0评论2026-06-2811

柏林动物园为动物“送清凉” 应对极端高温天气
德国正经历历史性极端高温天气,柏林动物园为确保动物们舒适度夏,根据每种动物的生活习性制定了不同的防暑方案。大熊猫馆启动了恒温空调系统,以保持室内温度在适宜大熊猫生活的范围内。从大熊猫到老虎再到大象,各种动物都有各自的降温措施

0评论2026-06-2811

在广东多少分能上这些大学 2025年录取线揭晓
2025年广东本科各大学的最低录取分数线为:历史类424分到627分、物理类425分到662分。广东公办本科院校排名前三的是中山大学(全国第14位)、南方科技大学(全国第15位)和华南理工大学(全国第25位)

0评论2026-06-2811