分享好友 资讯首页 资讯分类 切换频道

谷歌推出压缩算法 实现约6倍内存节省

2026-03-28 02:30210两砚网财联社

谷歌近日推出了一种新的压缩算法TurboQuant,旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大,这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下,将键值缓存压缩至3比特精度,并且基本保持模型准确率不受影响。

测试结果显示,TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中,与未量化的键向量相比,该算法最高可实现约8倍的性能提升。研究人员表示,这项技术不仅适用于AI模型,还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。

收藏 0
打赏 0
阿里员工十三薪并入年终奖 调整为“并肩前行奖”
5月27日,阿里发布全员信宣布自2027财年起,员工的十三薪将并入年终奖,改名为“并肩前行奖”,与年终奖一同发放。年终奖将由“并肩前行年奖”和“绩效年奖”两部分组成,单独列示。调整后,十三薪的发放时间将从之前的春节当月顺延至4—5月

0评论2026-05-2814

德国华人迷奸案细节披露 跨国性侵团伙宣判
2026年5月,德国法兰克福、慕尼黑、柏林三地法院对“德国高级驾校”跨国性侵团伙系列案件陆续宣判

0评论2026-05-2814

菲执法部门抓扣中国公民中方严正交涉 依法公正处理案件
5月27日,中国驻菲律宾大使馆发言人就菲律宾执法部门近来频繁抓扣中国公民表达了立场。中方高度重视维护在菲中国公民的人身安全与合法权益,对菲律宾军队和执法部门近期频繁抓扣中国公民表示严重关切

0评论2026-05-2816