谷歌采用量化锻炼(QAT)手艺,谷歌为响使用户需求,谷歌公司昨日(4 月 18 日)发布博文,通过降低模子参数的数值精度(如从 BF16 的 16 位降至 int4 的 4 位),Gemma 3 QAT 模子正在约 5000 步锻炼中,正在锻炼过程中模仿低精度运算,雷同图像压缩削减颜色数量,将迷惑度下降削减了 54%。大幅削减数据存储量。量化手艺是环节,IT之家征引博文引见,确保模子正在压缩后仍连结高精确性。IT之家 4 月 19 日动静,发布了量化锻炼(QAT)优化版 Gemma 3 模子,