打破广告变现天花板!快手 GR4AD:生成式推荐大规模落地,4 亿用户验证新范式
大语言模型(LLM)掀起的生成式浪潮,正在重塑互联网核心基础设施。推荐系统作为互联网平台最核心的商业引擎之一,也迎来了范式级变革的关键时刻。
传统广告推荐系统沿用深度学习排序模型(DLRM)的级联架构多年,在时延、收益、商业价值等方面已逼近瓶颈。要突破天花板,关键在于引入生成式 AI 范式,从表征编码、学习目标到推理服务进行全链路重构。
快手技术团队最新提出的「GR4AD」系统(Generative Recommendation for ADvertising),正是这一方向的工业级突破。它是国内生成式推荐在大规模广告场景下的首次全量落地,围绕表征、学习、服务三大层面协同设计,实现了广告变现效果的全面跃升。
目前,GR4AD 已全量部署于快手广告平台,服务超过 4 亿用户,在用户与生态维度,基于内容语义的 SID 索引带来了更强的泛化能力和更实时的冷启动支持,实现了平台、广告主、用户的三赢:广告主侧中小商家投放量提升 17.5%,用户侧低活跃用户转化率提升 7.28%,平台整体广告收入增长 4.2%。为广告推荐系统从传统 DLRM 迈向端到端生成式架构提供了首个工业级可行方案。

论文链接:https://arxiv.org/pdf/2602.22732
GR4AD 的设计哲学可以用一句话概括:不照搬 LLM,做推荐原生的设计。快手技术团队深刻认识到,广告场景对时延、收益和商业价值有极致要求,不能简单套用 LLM 的训练和推理范式,必须在三个层面进行专门设计。
广告 Token 化——给每条广告一个"身份证"(UA-SID)
广告物料不同于普通内容,融合了视频创意、商品详情、广告主元数据等多模态信息,还包含转化类型、账户 ID 等高商业价值但无语义内容的业务信号。GR4AD 提出了统一广告语义 ID(UA-SID)方案:通过端到端微调的多模态大模型(MLLM)生成统一广告嵌入,再经过多粒度-多分辨率量化(MGMR RQ-Kmeans)将其编码为离散 Token 序列。该方案将 SID 碰撞率从 85.44% 大幅降至 18.26%,码本利用率提升 3 倍以上,为新广告物料实现秒级冷启动索引。

学习范式——面向商业价值的全链路优化
广告推荐的核心目标是最大化商业价值,而非单纯猜中用户偏好。GR4AD 创新引入价值感知监督学习(VSL)与排序引导强化学习(RSPO)的统一训练框架:VSL 将 eCPM 收益信号直接融入学习目标,并对高价值用户和深度交互行为给予更高权重;RSPO 则以列表级 NDCG 为优化方向,通过强化学习直接对排序质量进行精细化提升。实验证明,RSPO 是所有优化组件中单项增益最大的,显著优于 DPO、GRPO 等主流对齐算法。
推理服务——为广告场景专门设计的高效解码
广告系统需要在极高 QPS 和极低延迟下同时生成大量高质量候选,这与 LLM 对话场景的解码需求存在本质差异。GR4AD 提出 LazyAR 懒惰解码器,将前序 Token 的依赖"延迟"注入,使多路 Beam 的前段计算得以并行共享,在几乎不损失推荐质量的前提下将推理吞吐量翻倍。结合动态 Beam 服务(DBS)、KV Cache 共享、FP8 低精度推理等工程优化,最终实现 <100ms 延迟、500+ QPS/L20 GPU 的工业级服务能力。

在线实验效果
GR4AD在快手广告平台各核心指标上均取得显著正向收益,在大盘收入提升4.2%+的同时,推理吞吐量翻倍,延迟控制在 100ms 以内,目前已完成100%流量部署。快手技术团队同时也验证了大模型的两个基本规律在广告推荐场景依然有效,模型的 Scaling Law:模型参数从 0.03B 扩展至 0.32B,广告收入增益从 +2.13% 单调提升至 +4.43%;Beam 搜索宽度从 128 增加至 1024,收入增益从 +2.33% 提升至 +4.21%,这表面更强的推理时搜索能进一步释放模型潜力,与当前 LLM 领域 Test-time Scaling 的趋势遥相呼应。
生成式推荐正式进入广告核心战场
生成式 AI 方兴未艾,GR4AD 最核心的价值,在于它并非简单地将 LLM 技术嫁接到广告系统,而是从广告业务的本质出发,重新定义了"Token 该怎么编、模型该怎么学、候选该怎么生成"这三个根本性问题,走出了一条推荐原生的设计路径。这意味着,生成式推荐不再只是效果指标的边际改善,而是真正触达了广告系统的商业价值链条——从 Token 的生成到 Revenue 的增长,全链路被彻底重构。可以预见,随着 GR4AD 范式的确立,广告推荐领域将加速告别 DLRM 时代,越来越多的平台将沿着这条路径,推动广告系统迎来属于自己的「生成式觉醒」时刻。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
直击数智化创新一线:探访河南向新之力
数智浪潮奔涌向前,创新动能生生不息。近日,飞象网记者跟随“数智河南 多彩中原”河南新质生产力主题媒体探访活动赶到郑州、开封等地,直击数智化创新一线。从农业生产到乡村管理,从文旅产..[详细]
敲开苹果护城河,安卓厂商聚焦兼容苹果生态
要说苹果iPhone的优势在哪?很多用户最舍不得抛弃的一点莫过于与Mac、iPad设备的优秀生态兼容性,无论是一点即传的AirDrop,还是随时自动同步iCloud,这一生态能力某种程度上也成为苹果维持..[详细]
6G要爆发?原型机密集发布,6G三大技术集体亮相
2026年以来,全球6G发展加速驶入快车道,6G的标准制定、原型研发、技术突破、产业规划等均取得标志性进展。3GPP已启动6G标准起草工作,进入规范制定关键窗口;ITU也发布相关报告,明确6G关键..[详细]
三大运营商2025年报:营收稳中有进 算力等新兴产业成效显现
近日,中国移动、中国电信、中国联通三大电信运营商2025年年度报告已全部对外披露。作为我国数字经济发展的“国家队”与主力军,三大运营商在2025年顶住行业竞争加剧、传统业务增长趋缓等多..[详细]
告别“大黑屏” 智能手机如何走出增长困局?
从首款智能手机问世至今十余年间,这块握在掌心的 “大黑屏” 曾凭借不断刷新的硬件参数掀起一轮轮换机潮,成为移动互联网时代的核心载体。但如今,全球手机市场早已告别高速增长,换机周期..[详细]
中国电信2025年财报透视:双轮融合发力 “AI+”重构增长逻辑
2025 年,中国电信紧扣数字经济与人工智能发展浪潮,完成云改数转向云改数转智惠的战略升级,全年经营业绩稳健收官,核心业务稳固、创新业务高增、数字基建持续加码,在算力、AI、量子、低空..[详细]
当速率不再是核心主题,5G网络好坏如何重新考量?
回首5G网络部署之初,宣传口径往往聚焦于“速率”,但历经时间的反复押韵,很多受众都发现,原来“看电视”这项用例,可以从3G一直宣传到5G。而当如今人们在谈论6G的时候,终于不用再看到满..[详细]
刘烈宏:以高质量数据赋能AI创新,加快培育智能经济新形态
当前,人工智能发展正经历着一场前所未有的加速演进,一个又一个热点事件接连涌现。在技术创新与商业应用的双轮驱动下,人工智能产业规模持续增长,从去年春节DeepSeek开源模型出圈,到机器..[详细]
AI赋能中小企业仍处于初期探索阶段
新一代人工智能正在全球范围蓬勃兴起,成为新一轮科技革命和产业变革的战略性技术和重要驱动力量。开展人工智能赋能中小企业高质量发展研究,既是人工智能技术推进规模化商业化应用、加速向..[详细]













