通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102535
跳转到指定楼层
1#
发表于 2026-3-27 09:45:45 |只看该作者 |倒序浏览
智东西3月26日报道,昨天,谷歌于发布了一款针对大语言模型键值缓存(KV Cache)的无损极限压缩算法TurboQuant,它能够从根本上解决向量量化中内存开销问题。谷歌称,TurboQuant可将大语言模型键值缓存内存占用至少降至原来的1/6,推理速度最高提升8倍,同时保持100%精确程度。


Cloudflare的联合创始人、CEO兼执行主席Matthew Prince称,谷歌推出TurboQuant堪称“谷歌的DeepSeek时刻”。


向量量化一直是企业为AI数据 “瘦身” 的主流技术,主要用于压缩高维向量、节省内存、提升检索与推理效率。但传统压缩方法通常会引入额外的内存开销(每一小块数据都要单独算、单独存一套完整的“压缩参数”),这些参数很占内存,每个数字都要多占1-2 bit,这样反而会影响向量量化的效果。

谷歌称,此次推出的TurboQuant借助了谷歌提出的1 bit无偏误差校正算法QJL与极坐标量化压缩技术PolarQuant,实现了压缩算法的突破。

谷歌官宣推出TurboQuant后,引发资本市场短期内对该技术会降低存储芯片采购需求的担忧,导致存储芯片板块集体回调。

当天美股盘中,美光股票跌幅超过5%,收盘时下跌3.4%,市值蒸发约151.6亿美元(约合人民币1047.37亿元)。闪迪股票下跌幅度更大,一度超过7%,收盘时下跌3.5%,市值蒸发约36.44亿美元(约合人民币251.75亿元)。韩股收盘时,SK海力士股价下跌了6.23%。


举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-3-27 12:57 , Processed in 0.077353 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部