大模型时代的广告营销变革与实践

作者:京东零售技术日期:2025/10/25

大模型时代的广告营销变革与实践

互联网领域,广告营销是一种核心业态,也是先进技术和研究成果的商业化进程最快的一种渠道。伴随生成式大模型的浪潮汹涌袭来,京东广告结合自身业务特性和电商零售的新业态,推出了自主研发的广告营销商业化场景大模型,并据此带来了一场深刻的技术和业务变革。

在2025年9月25日,京东JDD(京东全球科技探索者)大会的Oxygen 智能零售论坛上,京东广告团队做了题为《大模型时代的广告营销变革与实践》的报告。

核心观点

1. 通用大模型想解决营销领域问题需向垂类模型转型。

“全才”通用大模型难覆盖广告营销全流程,需升级为“懂营销”的垂直模型,实现从“知道”到“落地执行”的三维跨越。

2. 广告智能体破解传统投放门槛高效果不稳定难题。

把简单留给客户,让复杂交给AI。传统投放对中小商家门槛高,广告投放智能体凭“一句话指令”实现自动化操作与调优,让广告主从 “操作岗” 解放出来,专注做 “战略岗”。

3. 端到端建模而非分阶段传统算法建模,GRAM助力广告建模代际突破。

AI电商时代的端到端LLM召排一体能力,借助GRAM(Generative Retrieval and Alignment Model,生成式检索对齐模型)实现“意图识别、检索、排序、机制” 有机融合。

4. 广告创意优化引入CTR建模,除了要解决“好看”的问题还需要解决效果难题。

京东广告的图像、视频的生成+优选能力,破除传统生成技术“好看但不转化”问题,以CTR为指导,平衡视觉审美与商业价值。

5. 广告算法、数据、算力协同优化非硬件堆砌,实现大模型超低延迟推理能力。

算法、算力等实时化能力是广告长期追求的。通过定制化和芯片级优化工作,让大模型从大规模“纸上谈兵”到“毫秒级实时服务”,实现“业务级算力”落地。

6. 三驾马车驱动广告算法长期演进。“数据、算法、算力”协同将推动广告算法持续变革,最终实现三方共赢。

演讲实录

以下是演讲实录(经不改变原意的编辑整理)

图片

很荣幸和大家一起探讨一个核心话题 —— 大模型时代的广告营销变革与实践,而我们今天的主角,就是京东自主研发的广告营销大模型体系。可能很多朋友会好奇,大模型到底能给广告营销带来什么?是效率的微小提升,还是模式的彻底重构?接下来我会从技术发展、产品落地到行业实践,带大家全面看清这场变革的全貌,也让大家感受 JoyAI Oxygen 如何把 “复杂的技术” 变成 “好用的工具”,把 “营销的难题” 变成 “增长的机遇”。咱们现在就正式开始!

一、广告营销领域大模型的发展

图片

我们先聊聊大模型在广告营销领域的 “成长路径”。其实现在整个行业的大模型,已经走过了 “从零散能力到系统能力” 的关键阶段,从过去几年的大模型发展历程来看,尤其是从22年以对话式大模型发布以来,业内的日常对话式的大模型不论是基础模型还是领域精调的模型都日益成熟,甚至是实现了局部的“跨学科整合”。现在的大模型不再只懂 “单一技能”,像经验中学习、数学逻辑推理,甚至文本图像创作、代码编写、日常对话这些单个领域,都已经发展得比较成熟了 —— 这就好比以前是 “专才”,现在变成了 “全才”,但能不能能应对广告营销里从策略到执行的多环节需求,依然存在不小的挑战。主要能总结成3个核心方向:

第一是从通用到专用。通用大模型懂 “通识”,但广告营销需要 “垂类能力”—— 比如怎么根据行业季节趋势做投放决策、怎么理解用户的深层消费需求,这些都需要我们把垂类知识、连续决策能力、推理感知能力注入进去,让模型从 “懂常识” 变成 “懂营销”。如何进一步打造投放能力与提升投放效率也是我们要破解的难题。

第二是从理解到决策。以前的 AI 可能只能 “看懂数据”,比如告诉你 “这个计划 ROI 低”,但现在的大模型能直接给方案 —— 这背后其实要解决三个大挑战:体量大的垂类数据怎么处理、高难度的推理感知技术怎么落地、广告主需求理解、终端用户理解和连续决策,这些都是我们要突破的关键点。

第三是从算法到算力。算法再好,没有足够的算力支撑也跑不起来,尤其是广告营销需要实时响应,这就要求我们在算法优化的同时,必须解决算力的效率和安全问题 —— 这也是我们后面会重点讲的 “硬实力”。

简单说,大模型给广告营销的,不是 “锦上添花” ,而是 “换道超车” 的机会。下面我们分别来看这三个难题如何解决。

二、广告投放智能体:把简单留给客户,把复杂交给AI

图片

广告投放智能体:一句话实现广告投放的自动化智能化

有了大模型作为基础,怎么把它变成广告主能用、好用的工具?答案就是广告投放智能体 —— 核心一句话:把简单留给客户,把复杂交给 AI。

大家可以回想一下传统广告投放是什么样的:要自己做操作,比如调预算、改定向;要自己做决策,比如哪个计划该加投、哪个该暂停,全靠经验和零散数据;最后效果好不好,还得被动等数据反馈,有问题再答疑。整个过程又累又容易出错,尤其对中小广告主来说,门槛太高了。当然,过去几年业内主流广告平台在过去几年提供了很多智能投放的工具能力和诊断分析能力,包括我们自己的京东广告平台——京准通,但是我们认为依然做的不够。

但有了投放智能体,完全不一样了 ——一句话就能驱动所有动作。比如你说 “ROI≥2 且消耗>100 的计划,预算 +20%”,或者 “优化计划 542486x”,后面的事就不用管了:

  1. 编辑 Agent 会自动处理计划的参数调整;
  2. 投放 Agent 会执行预算分配和投放策略;自动完成商家经营情况分析、历史投放分析、操作历史分析、投放偏好分析、行业竞对分析,给出投放产品推荐、人群、预算、出价、创意等全套设置步骤。
  3. 优化 Agent 会实时盯着数据,要是效果有波动,还会主动调整,而不是等你问。

以前需要花几小时甚至几天的操作,现在一句话、几秒钟就能搞定。这不仅是效率的提升,而是把广告主从 “操作岗” 解放出来,专注做 “战略岗”。

图片

投放智能体背后的“大脑”与“手脚”

那这个 “一句话驱动” 的背后,靠的是什么?其实是一套专注营销的 “大脑 + 手脚”—— 也就是多 Agent 协作体系。

首先看 “手脚”:我们有成百上千个Agent,这里看四个核心 Agent,分别负责广告优化、广告投放、广告编辑和广告创意,覆盖从策略到创意、从投放 to 优化的全流程。比如创意 Agent 能自动生成广告素材,优化 Agent 能实时调策略,四个 Agent 不是各自为战,而是靠 “规划和协作” 机制联动。

再看 “大脑”:要让 Agent 们协作顺畅,得有三大技术支撑:

第一是ReAct 框架—— 让智能体不仅能 “思考”(分析数据和需求),还能 “行动”(执行操作),不是只会算,而是能落地;

第二是A2A 协议—— 这是 Agent 之间的 “沟通语言”,广告设计、优化、分析之间能实时同步信息,不会出现 “优化 Agent 调了预算,投放 Agent 不知道” 的情况;

第三是长短期记忆管理—— 让智能体既能记住 “当下的需求”(比如你现在要加预算),也能继承 “过去的经验”(比如去年这个季节同类产品怎么投效果好),不会每次都 “从零开始”。

最后,光有技术还不够,我们还往 “大脑” 里装了 “知识”:通过 SFT(监督微调)让模型快速适应广告场景,通过 RLHF(基于人类反馈的强化学习)让模型更懂广告主的真实需求,再注入实时的行业数据,让模型能跟着季节、趋势迭代 —— 比如 618 前会自动预判大促流量规律,春节前会调整年货相关的投放策略。

简单说,这套体系不是 “单个 AI 在干活” ,而是 “一个 AI 团队在服务你”

三、召排一体——GRAM:面向AI电商的LLM广告代际突破

图片

召排一体思想实现端到端生成

解决了广告主“投放”的问题,我们再看广告营销的另一个核心环节 ——“召排一体”,在面向终端消费者的场景上,对应胡喜总前文提到的AI驱动的电商,也就是怎么把用户需求和商品精准匹配上的同时还要融合广告主营销的诉求。这也是大模型给我们带来的代际突破。

说说传统的 “级联架构” 有什么问题:它是 “黑盒式” 的 —— 用户输入搜索词、浏览历史后,系统会经过聚合、召回、排序等多个模块,每个模块各自迭代,中间没有统一的 “意图理解” 。结果就是:多模块迭代复杂,改一个地方可能影响一串;相关性匹配缺乏用户深层意图的理解,比如用户搜 “夏天用的小电器”,可能推了风扇但没推驱蚊器;而且解释性差,你问 “为什么推这个商品”,系统说不清楚。

但 LLM 时代的 “召排一体” 是完全不同的 “白盒式” 逻辑 ——端到端的需求推理与满足。整个链路是 “用户请求→thinking→场景→需求→商品”:

比如用户说 “给宝宝选夏天防蚊的”,LLM 会先 “思考”:场景是 “宝宝使用”,需求是 “温和防蚊”,然后直接解码到对应的 SKU(比如儿童专用驱蚊液)。这里面有两个关键:

第一是 “用户意图编码”,把模糊的请求变成清晰的需求标签;

第二是 “奖励模型”,会根据用户点击、转化数据实时调整,让推理越来越准。

最终实现的是 “用户画像→需求→商品” 链路一体化,不再是 “各管一段”,而是 “从需求到商品一步到位”。

图片

京东广告流量端生成式模型架构——GRAM

有了召排一体的逻辑,我们在京东的流量场里落地了一个核心模型 ——GRAM(Generative Retrieval and Alignment Model,生成式检索对齐模型) 。它的核心作用,就是让 “用户请求” 和 “商品” 精准对齐,并在符合广告主的营销诉求的约束下运转。

大家可以看一下模型的逻辑:

首先是 “生成式检索”:当用户输入一个 Query(比如 “轻薄防晒衣”),GRAM 的 “Query-code generator” 会生成对应的 “请求编码”;同时,商品标题会通过 “Product-code generator” 生成 “商品编码”—— 这就好比给用户需求和商品都发了 “统一的身份证编码”。

然后是 “对齐(Alignment)”:系统会把 “请求编码” 和 “商品编码” 做匹配,不管是稀疏检索还是稠密检索,都能快速找到最匹配的商品;接着再经过预排序、精排序,最终推给用户。

我们借助生成式大模型技术完成了QP、Retrieval、Pre-Ranking和Ranking的全过程,并且我们的研发工程师将上述的过程已经压缩到了30-50ms级别的P99时延内,破解了传统大模型无法在广告场景实时推理的难题。

更重要的是,GRAM 不是 “一次性匹配”,它还有 “近线系统(Nearline System)”:会通过用户反馈(比如点击、购买)不断更新 “商品编码库”,让匹配越来越准。比如用户搜 “轻薄防晒衣” 但买了带冰感的,下次就会优先推冰感材质的 —— 真正实现了 “意图识别、检索、排序、机制” 几者融合,让服务既快又准。

四、广告创意优化:引入CTR建模,平衡美观与广告商业价值

图片

强化学习结合CTR驱动的AIGC图片生成

除了 “找人找货”,我们也针对用户视觉面积最大的区域——图片和视频做了生成改进,我们还做了业界首个基于强化学习结合 CTR(点击通过率)驱动的 AIGC 图片生成模型。 传统的 AIGC 图片可能只好看,但不一定能带来点击;而我们的生成逻辑是 “效果导向”:

首先,我们会给模型一个 “指令(Instruction)”,比如 “生成一款适合敏感肌的防晒霜广告图,突出温和、防晒指数 SPF50+”;

然后,“奖励模型(Reward Model)” 会介入 —— 这个模型是用大量广告的 CTR 数据训练的,知道 “什么样的图片更容易被点击”,比如颜色搭配、文案位置、产品展示角度;

最后,LLM 会结合指令和奖励模型的反馈,生成既符合创意需求、又能提升 CTR 的图片。

大家可以看屏幕上的示例:“驱蚊更温和”“超 A 质地巨轻盈”“2800mg 精华”“不到 2 分钟起效”—— 这些文案不是随便加的,都是 CTR 数据证明 “用户更关注” 的点;图片的色调、产品摆放也都是经过效果验证的。这样生成的图片,不用再靠 “感觉” 判断好不好,而是有数据支撑的“好”。

相关工作也发表在 ECCV 及 WWW 上。

图片

基于多策略评估体系的视频智能体

除了图片之外,视频广告的需求也越来越大,所以我们还打造了基于多策略评估体系的视频智能体(Agent) 。它的核心是 “不只是生成视频,而是生成能带来效果的视频”。整个流程是 “从输入到投放全闭环”:

第一步是 “输入规划”:你给一个需求(比如 “生成一款化妆品的短视频,突出抗衰老、时尚”),Planning Model 会结合 “素材库”“专家视频库” 做策略规划,比如用 “数字人讲解 + 产品实测” 的形式;

第二步是 “多策略生成”:系统会同时尝试多种方案 —— 比如故事脚本生成(讲一个试用者的故事)、视频摘要(剪产品核心卖点)、数字人出镜、图转视频(静态图变动态)、口播文案生成,还会自动配 BGM、加字幕和语音;

第三步是 “评估优化”:Evaluation Model 会结合两个维度评估:一是 VLM(视觉语言模型)的质量评估(画面是否清晰、文案是否通顺),二是在线 CTR 数据反馈(用户是否愿意看、是否点击);然后 Summary Model 会根据评估结果迭代策略,比如发现 “数字人讲解” 的 CTR 更高,下次就优先用这个策略;

最后是 “上线投放”:确定最优策略后,直接对接投放系统,实现 “创意生成→评估→投放” 一体化。

这样一来,就算你没有专业的视频团队,也能快速生成高质量、高转化的广告视频。

五、广告算力协同优化,实现大模型超低延迟实时推理

图片

面向广告业务特性的超低延迟推理定制化解法

不管是投放、召排还是创意生成,广告业务有个核心要求 —— 实时响应。用户的需求转瞬即逝,延迟一毫秒可能就丢了一个转化。所以我们专门做了 “超低延迟推理定制化解法” ,解决 “快” 的问题。具体有三个关键点:

第一是超低延迟 & 调度优化。我们用了 PD 混合调度、异步算子调度技术,把 P99 延迟(也就是 99% 的请求响应时间)压缩到了原来的十分之一,甚至几十分之一—— 比如以前要几百毫秒甚至几秒,现在只要 30-50 毫秒,完全能跟上用户的实时需求;

第二是定制化模型 & 受限生成。我们会裁切模型的 LM Head 权重、做 Logits Mask,这样能降低 token 的概率空间和 BeamSearch 的搜索空间 —— 简单说就是 “让模型少走弯路”,吞吐能力提升了 70% 以上,能同时处理更多请求;

第三是算力安全 & 异构计算。我们重新思考和设计了混合算力模式下的异构推理能力,让各种算力混合调度,借助CPU-xPU 异构资源池和可信执行能力 —— 既能保证高吞吐、低时延,又能确保数据安全,不会出现数据泄露的问题。

总结一下:这套解法让我们的大模型不仅 “聪明”,还 “反应快、更安全”。

图片

基于 ARM 国产芯片的服务与推理优化

除了延迟和安全,我们还做了基于 ARM 国产芯片的服务与推理优化,让大模型能在国产硬件上高效运行,实现算力自主可控。这里有三个核心优化方向:

第一是KV-Cache 优化。我们搭建了 SSD/SRAM-DRAM/HBM 三级缓存,用异步读取的方式加速计算 —— 就好比给模型建了 “快速存取的仓库”,让通信、算力的调度协调起来,形成巨大的计算加速收益;

第二是指令集优化。在CPU侧的特征计算和DNN计算上,我们跟合作伙伴深度优化后的鲲鹏 KDNN 算子,和开源的 oneDNN 比,通过向量化、软硬件预取等技术,在 Matmul(矩阵乘法)、Conv(卷积)这些核心计算上算子,较业内开源至少提升30%,几乎带来了1-2个芯片制程代际的领先。

第三是编译优化。我们做了高性能图编译、亲和图编译优化,还有指令级别的自动调优 —— 让模型能更好地适配 ARM 芯片的指令特点,发挥硬件的最大性能,至少带来了10%以上的提升。

这一步的意义,不只是 “降成本”,更是让数据、算法、算力这三驾马车也将在未来持续助力京东在大模型时代的广告营销持续演进和变革,也为我们的广告主、消费者带来更高的效率、更优的体验、更极致的产品服务。

六、展望&结语

图片

让广告主更省心、让消费者更开心!

从大模型在广告营销领域的 “通用到专用、理解到决策、算法到算力” 3大发展方向,到广告投放智能体、召排一体体系,再到 GRAM 模型、AIGC 创意生成、超低延迟推理、ARM 国产芯片优化 —— 我们做的所有事情,核心只有一个:让大模型真正服务于广告营销的 “价值” ,让广告主更省心、更高效,让用户看到更精准、更有价值的广告。

当然,大模型给广告营销的变革才刚刚开始,后面还有很多可能性等着我们一起探索。期待更多行业有志之士加入我们,共建大模型时代的广告营销新生态!谢谢大家!

非常欢迎有想法有意愿的同学加入本团队,简历投递:[email protected]

图片


大模型时代的广告营销变革与实践》 是转载文章,点击查看原文


相关推荐


【Java】基于 Tabula 的 PDF 合并单元格内容提取
Kida的躺平小屋2025/10/22

坑还是要填的,但是填得是否平整就有待商榷了(狗头保命...)。 本人技术有限,只能帮各位实现的这个地步了。各路大神如果还有更好的实现也可以发出来跟小弟共勉一下哈。 首先需要说一下的是以下提供的代码仅作研究参考使用,各位在使用之前务必自检,因为并不是所有 pdf 的表格格式都适合。 本次实现的难点在于 PDF 是一种视觉格式,而不是语义格式。 它只记录了“在 (x, y) 坐标绘制文本 'ABC'”和“从 (x1, y1) 到 (x2, y2) 绘制一条线”。它根本不“知道”什么是“表格”、“


猿辅导Java面试真实经历与深度总结(二)
360_go_php2025/10/22

​ 在面试中,掌握Java的基础知识和深入的理解是非常重要的。今天,我们来解析几个常见的Java面试问题,包括线程状态、线程池、深拷贝与浅拷贝、线程安全、Lock与Synchronized的区别,以及逃逸分析等话题。 1. 线程状态 Java中,线程有七种状态,它们是由 Thread.State 枚举类定义的。线程的状态随着程序的执行而发生变化,下面是七种状态的描述:​编辑 NEW:线程被创建,但尚未启动。 RUNNABLE:线程可以运行,或者已经正在运行。线程调度器选择合适的线程让它执行


Docker 通信核心:docker.sock 完全指南
做运维的阿瑞2025/10/20

阅读时长: 15min | 难度: 中级 | 作者: 做运维的阿瑞 | 更新时间: 2025-10 文章目录 前言一、Docker 通信原理总览1.1 技术架构解析1.2 核心技术对比 二、核心用法与技巧2.1 容器内访问宿主机 Docker2.2 使用 Docker SDK2.3 直接与 API 交互 三、安全风险与最佳实践Q1: 有多危险?为什么说拿到 `docker.sock` 就等于 `root`?Q2: 如何安全地授权用户使用 Docker?Q3: 有没有比挂


自定义Spring Boot Starter项目并且在其他项目中通过pom引入使用
劝导小子2025/10/19

1、创建starter项目 我电脑只有JDK 8,但是创建项目的时候最低只能选择17,后续创建完后去修改即可 2、项目结构 删除主启动类Application:Starter不需要启动类删除配置文件application.properties:Starter不需要自己的配置文件删除test里面的测试启动类 在resources下创建META-INF文件夹 3、修改JDK 修改成JDK8,如果你有更高的版本请切换 4、配置pom.xml <?xml version="1


RabbitMQ消息传输中Protostuff序列化数据异常的深度解析与解决方案
Mr.45672025/10/18

目录 问题背景 环境配置 使用的依赖 测试对象 初始代码(有问题的版本) 问题分析 1. 初步排查 2. 关键发现 3. RabbitTemplate的默认行为分析 4. SimpleMessageConverter的处理机制 深入理解消息转换 消息转换器的层次结构: 而直接发送 Message: 解决方案 方案1:直接使用Message对象(推荐) 方案2:配置自定义MessageConverter 问题根因总结 经验教训 结论 最后最后附上序列化工具:


Apache Doris 与 ClickHouse:运维与开源闭源对比
SelectDB技术团队2025/10/16

引言 在当今数据驱动的商业环境中,OLAP(在线分析处理)数据库的选择对企业的数据分析能力和运维成本有着深远影响。Apache Doris 和 ClickHouse 作为业界领先的高性能 OLAP 数据库,各自在不同场景下展现出独特优势。 Apache Doris 以其优秀的宽表查询能力、多表 JOIN 性能、实时更新、search 以及湖加速特性而著称。ClickHouse 同样在宽表处理方面表现出色,其丰富的分析函数库和高性能单表聚合能力备受青睐。 然而,从运维角度来看,两者在存算分离


统一高效图像生成与编辑!百度&新加坡国立提出Query-Kontext,多项任务“反杀”专用模型
AI生成未来2025/10/15

论文链接:https://arxiv.org/pdf/2509.26641 亮点直击 Query-Kontext,一种经济型集成多模态模型(UMM),能够将视觉语言模型(VLMs)中的多模态生成推理与扩散模型执行的高保真视觉渲染相分离。 提出了一种三阶段渐进式训练策略,该策略逐步将 VLM 与越来越强大的扩散生成器对齐,同时增强它们在生成推理和视觉合成方面的各自优势。 提出了一种精心策划的数据集收集方案,以收集真实、合成和经过仔细筛选的开源数据集,涵盖多样的多模态参考到图像


微美全息(NASDAQ:WIMI)融合区块链+AI+IoT 三大技术,解锁物联网入侵检测新范式
爱看科技2025/10/14

在全面数字化转型的浪潮中,区块链、网络安全、人工智能与机器学习不再是孤立的技术概念,而是相互交织、共同推动行业进步的强大引擎。这些技术的紧密结合,特别是在物联网(IoT)领域的应用,正引领着一场前所未有的安全、效率与智能化变革。   实际,区块链技术以其去中心化、安全性和不可篡改性,为物联网数据存储和共享提供了全新的解决方案。而人工智能与机器学习技术的应用,使得物联网系统具备了自我学习和优化的能力。机器学习算法能够分析海量数据,识别出潜在的安全威胁或性能瓶颈,为系统提供精准的决策支持。


基于旗鱼算法优化卷积神经网络结合长短期记忆网络与注意力机制(CNN-LSTM-Attention)的风电场发电功率预测
智能算法研学社(Jack旭)2025/10/12

基于旗鱼算法优化卷积神经网络结合长短期记忆网络与注意力机制(CNN-LSTM-Attention)的风电场发电功率预测 文章目录 基于旗鱼算法优化卷积神经网络结合长短期记忆网络与注意力机制(CNN-LSTM-Attention)的风电场发电功率预测1.CNN原理2.LSTM原理3.注意力机制4.CNN-LSTM-Attention5.风电功率预测5.1 数据集6.基于旗鱼算法优化的CNN-LSTM-Attention7.实验结果8.Matlab代码 1.CNN原理 卷积神经


C++ const 用法全面总结与深度解析
oioihoii2025/10/10

1. const 基础概念 const 关键字用于定义不可修改的常量,是C++中确保数据只读性和程序安全性的核心机制。它可以应用于变量、指针、函数参数、返回值、成员函数等多种场景,深刻影响代码的正确性和性能。 1.1 本质与编译期处理 const变量在编译时会被编译器严格检查,任何修改尝试都会导致编译错误。与C语言不同,C++中的const变量(尤其是全局const)通常不会分配内存,而是直接嵌入到指令中(类似#define),但在以下情况会分配内存: 取const变量地址时 const变量为

首页编辑器站点地图

Copyright © 2025 聚合阅读

License: CC BY-SA 4.0