分享好友 资讯首页 资讯分类 切换频道

谁在闷头做中国的Mythos 速度暴涨4倍

2026-06-21 00:40110两砚网agent.csdn.net/6a30b91b662f9a5

别再只盯着“AO”两家的新模型大战了!谷歌刚刚发布了一款名为DiffusionGemma的新模型,这款模型将生成图片的扩散模型应用到了文字生成上,并实现了4倍加速。

DiffusionGemma抛弃了传统的自回归模式,即逐个token生成的方式,而是采用类似“印刷机”的工作方式。它一次铺开256个token的“画布”,从随机噪声出发,通过多轮去噪,使整段文字同时浮现。这种新模式在生成速度方面表现出色:单块H100上每秒可生成1000多个tokens,在消费级RTX 5090上也能达到700多个tokens,比同规格自回归模型快了4倍。此外,这个26B参数的MoE模型在推理时只需激活3.8B参数,量化后仅需18GB显存即可运行,一张4090显卡就能本地跑。

目前,DiffusionGemma采用了允许商用的Apache 2.0开源协议,权重可在Hugging Face直接下载。

DiffusionGemma的最大优势在于其生成速度。在同一块H100上(fp8,batch size=1),DiffusionGemma的速度达到了1000+ tokens/s,而标准自回归的Gemma 4 26B A4B加上MTP加速也只有300+ tokens/s,速度差距近4倍。

收藏 0
打赏 0
各地龙舟竞渡火热进行 安全措施全面升级
端午佳节,各地龙舟赛事火热开桨。全国各地坚持人民至上、生命至上原则,在组织龙舟民俗活动时注重安全生产。公安、海事、应急、卫健、乡镇基层多部门联动发力,从赛前排查、赛中管控到应急保障全链条细化举措,确保端午龙舟竞渡安全

0评论2026-06-2111

南充小孩骑车划伤宝马追2条街认错 诚实担当获车主原谅
6月19日,四川南充营山县一名小男孩骑车时不慎刮伤了一辆宝马轿车。小男孩追了两条街找到车主坦白了自己的过失,最终获得了车主的原谅

0评论2026-06-2111

广西继续发布洪水蓝色预警 多条河流将超警戒水位
6月20日11时,广西壮族自治区水文中心发布的信息显示,洛清江上游及支流西河、古偿河,红水河支流刁江,龙江支流小环江等5条河流的5个水文站出现超警情况,超警范围在0.05米至1.81米之间

0评论2026-06-2111