CN
|
EN
火山引擎谭待:AI新时代——大模型、Agent与推理规模化
中国绿公司年会

 

4月21日,2025年中国绿公司年会举办“人工智能”主题高级别闭门研讨。火山引擎总裁谭待以《AI新时代:大模型、Agent与推理规模化》为题进行了分享。他指出:“作为字节跳动旗下的云计算板块,火山引擎站在更底层的角度来看待行业的发展。”

 

谭待  火山引擎总裁

 

火山引擎是字节跳动旗下云与 AI 服务平台,提供抖音同款技术服务

火山引擎是字节跳动旗下云与 AI 服务平台,为抖音、豆包等提供技术支持,于 2020 年正式对外提供云、大数据和 AI 领域服务。作为云厂商,其优势在于能从底层资源消耗洞察行业发展,2021 年便意识到 AI 对云与 IT 的驱动作用并加大投入。

 

火山引擎领跑中国公有云大模型Token用量

从 2021 - 2024 年,AI 领域在云资源消耗上不断变化,从自动驾驶应用 Transformer 架构,到国内大模型和创业公司崛起,再到基础模型训练及应用发展。字节推出的豆包大模型采用多模态设计,同时发展 ToC 和 ToB 业务 。2024 年 12 月 - 2025 年 3 月,豆包日均 Token 使用量从 4 万亿增长到 12.7 万亿,反映出模型应用的飞速发展。根据IDC《中国公有云大模型服务市场格局分析》,2024 年,火山在公有云模型调用量上占比 46%,见证模型技术突破带动调用量增长。

 

迈进 Agent 元年,模型效果和 AI 云原生是关键方向

2025 年及未来,模型将从感知 AI、生成式 AI 向Agent AI 发展,真正有挑战的 Agent 需具备端到端处理复杂任务、多模态能力和操作工具的能力。实现这一发展的关键在于:模型要具备深度思考能力以完成复杂规划;采用多模态处理多源数据;发展 AI 云原生架构,使模型能操作各类界面;实现推理规模化,降低 Token 使用成本,推动 AI Agent 大规模应用。

 

豆包 1.5・深度思考模型,追求更好效果

火山引擎发布豆包 1.5 版深度思考模型,在数学、代码、专家推理等评测集上达到全球第一梯队水平。该模型参数设计创新,成本和延迟较低,具备 “边想边搜” 功能,可通过多轮迭代给出答案。同时,它原生支持多模态,能结合图像和文本进行深度思考,解决如出国点餐、企业流程图分析等实际问题。

 

AI 云原生,推动面向 AI 的架构创新和转型

研发 Agent ,除模型外,还需 AI 云原生组件。Agent 分为应用类和通用类,开发通用 Agent 需要强大的多模态深度思考模型,以及将电脑、代码、浏览器等封装成沙箱供模型操作,并通过相关框架实现模型在实际操作中学习。此外,模型能力提升还对安全、存储、网络等底层架构提出新要求,通过 AI 云原生架构可实现如自动生成营销文案等应用。

 

AI 云原生 - 让推理端到端更快、更省

随着豆包模型使用量增长,推理成本面临挑战,需对底层推理进行优化。通过新架构实现推理端到端更快更省,同时利用通用 Agent 可 7×24 小时工作的特点,将部分复杂任务安排在夜间互联网空闲时段进行,这也符合中国绿公司年会倡导的绿色发展理念,在保证经济效益的同时减少碳排放。

 

企业 AI 升级第一步?下载豆包 APP

对于企业 AI 转型,建议企业家先下载豆包 APP。因为大模型不同于传统云、大数据技术,个人通过使用 APP 能直观感受其在工作和生活中的作用,加深对技术的理解,从而思考如何在企业中应用,改变以往通过 PPT 汇报了解工作的方式。

 


2025年,CEC发起“永续发展绿色伙伴”社群,携手各行业领先企业,共建年度高级别、多维度、多场景的高级别研讨,构建长期的学习伙伴关系。

火山引擎作为首发伙伴,参与研发组织本届绿公司年会议题,并将持续共建主题研讨学习活动。