火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

AI快讯 2hours ago AICAT
0 0
火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

智东西

作者 | ZeR0

编辑 | 漠影

智东西于5月14日报道,火山引擎在5月13日举行的AI创新巡展·上海站活动中,展示了其大模型的全景图,并发布了豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,同时对豆包·音乐模型进行了升级。此外,Data Agent也首次亮相,国内首款AI原生IDE产品Trae已经接入了豆包深度思考模型,并进行了一系列功能升级。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

目前,火山方舟支持的模型涵盖了语言处理、深度思考、视觉理解、语音识别及GUI Agent等多个领域。

在会上,火山引擎副总裁张鑫指出,AI时代的新基础设施由模型、算力、数据与安全构成,火山引擎同时向外界提供这“四大要素”:

在模型方面,豆包大模型已在50多个内部实际场景及30多个行业的外部企业协作中发挥作用,截止到4月,日均tokens调用量已超过12.7万亿。

算力方面,火山引擎的AI云原生平台展现出强大的系统承载能力,包括丰富的算力、推理层优化及系统调度能力的综合效果。

在数据方面,数据飞轮2.0与Data Agent的结合,使用户能够基于不断演变的多模态数据湖,智能重组数据关系。

安全方面,火山引擎提供的大模型安全解决方案设立了PCC私密云计算平台,有效应对端云协同计算过程中的数据泄露风险,并通过大模型防火墙消除多种潜在攻击威胁。

一、视频生成模型:效果优异、生成速度快且更具性价比

新发布的豆包视频生成模型Seedance 1.0 lite,能够支持文字生成视频和图片生成视频,视频生成时长支持5秒和10秒,分辨率提供480P和720P选择。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

企业用户可以通过火山方舟平台访问该模型的API,而个人用户则能在豆包App和即梦体验中使用。

Seedance 1.0 lite作为豆包视频生成模型系列中的一个小参数量版本,实现了两项显著突破:一是影视级别的视频生成质量,二是视频生成速度显著增强,同时兼顾效果、速度和性价比。

(1)指令执行更加精准:凭借强大的语义理解能力,该模型可以精细控制人物的外观、气质、服装风格和表情动作等,并在多主体动作解析、嵌入式文本响应、程度副词和镜头切换反应方面表现优异。

(2)运镜表现更丰富:支持360度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言,基础画质细腻高清,具备影视级的视觉美感。

(3)运动交互更合理:能够分析动作时序与空间关系,提升人物与物体之间的自然流畅交互,运动轨迹和受力反馈更贴合现实规律。

Seedance 1.0 lite模型广泛适用于电商广告、娱乐特效、影视创作和动态壁纸等多种场景。例如,在电商领域,它能够帮助商家快速生成高质量的营销视频素材,精准匹配产品展示与活动推广等需求,从而降低制作成本和时间。

二、豆包1.5·视觉深度思考模型:在60项评测中夺得38项第一

新发布的豆包1.5·视觉深度思考模型(
Doubao-1.5-thinking-vision-pro),激活参数为20B,具备强大的多模态理解与推理能力,在60个公开评测基准中取得38项SOTA表现,在视频理解、视觉推理及GUI Agent能力方面均处于领先水平。该模型现已在火山方舟上线。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

在视频分析领域,豆包1.5·视觉深度思考模型具备动态帧率采样能力,大幅提升了视频时序定位的准确性。该模型结合向量搜索,能够精确识别出与文本描述匹配的视频片段。

此外,模型还引入了视频深度思考的功能,经过数万亿的多模态标记数据学习,掌握了丰富的视觉知识,并通过强化学习显著增强了视觉推理的能力。例如,面对复杂的图形推理任务时,模型能够提出假设并进行验证,若发现假设不符,则会不断进行反思,提出新的推测,直到找到正确答案。

豆包1.5·视觉深度思考模型还扩展了GUI Agent的功能,凭借其强大的GUI定位能力,能够在不同设备如PC和手机上高效完成复杂的交互任务,例如对新开发的App功能进行自动化测试。该功能目前已在字节跳动的多个App产品开发中得到应用。

去年,火山引擎推出了豆包·音乐模型。依托该模型,用户仅需一张图片或一句话,就能创作出十多种风格各异的高质量音乐。在此次大会上,豆包·音乐模型进行了升级,不仅支持英文歌曲的创作,还能通过对视频的理解,自动适配纯音乐背景音乐。

豆包·音乐模型现已全面上线,个人用户和企业用户均可在海绵音乐及火山引擎官网进行体验。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

三、火山方舟:无需登录,经济推理,3分钟完成DeepSeek全面部署

火山方舟是火山引擎旗下的一站式大型模型服务平台,提供语言、视觉、语音等多个模型的精细调优、推理和评测等服务。凭借丰富的插件生态和安全可靠的方案,企业和开发者的AI应用得以更加顺利地落地。

开发者可以在不登录的情况下,快速体验模型的功能。对于需要长期使用的实名用户,火山方舟简化了模型接入流程,用户只需2分钟即可完成模型的接入,无需经过多个页面。在安心推理的体验模式下,火山方舟不会主动消耗用户的付费资源,并支持按模型分配tokens。

火山方舟还推出了两种离线批量推理方案。其中之一是从存储中批量读取数据进行离线推理;另一种是通过类似在线聊天的模型接口,精确控制批量请求的动态负载,几分钟内即可完成开发适配。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

火山方舟为每位用户提供每天不少于100亿个token的批量推理额度,并以更具竞争力的价格出售。与在线推理相比,批量推理的费用下降了50%;如果使用前缀缓存,部分命中后的价格再降低40%;存储费用则为零。

此外,火山方舟提供超低延迟的小时级推理保障包,用户能够根据自身业务的实际流量曲线,灵活规划所需资源,无需在业务低迷期支付费用,从而实现成本节约。例如,Deepseek-R1的推理保障包可稳定提供每token 20ms的延迟,而豆包1.5 Pro的推理保障包则能将延迟降低至15ms。

极致性能的实现源自于充足的算力、深度的技术优化及卓越的系统调度能力。火山方舟凭借丰富的资源和先进的系统工程技术,提供高并发的算力保障与极致的服务体验。在多方评测中,火山方舟的Deepseek-R1服务始终保持最低的延迟表现。

这得益于火山方舟在算子层、框架层和调度层的深度优化:通过Prefill Decode分离式部署(PD分离)、存算分离、kernel优化和秒速扩容等技术,在异构硬件的协同优化及通信开销中实现了卓越的性能,确保方舟推理既快速又稳定。

有定制、部署及推理需求的企业客户,能够利用火山引擎的机器学习平台。这个平台与方舟共享相同的大型模型推理引擎,具备行业领先的生产级可用PD分离和分布式KV Cache能力。

火山方舟:颠覆传统的智能机器学习平台

火山方舟的机器学习平台成功简化了传统的部署流程。通过配置预设模型和镜像,以及采用PD分离的部署方式,用户只需短短1至3分钟,就能够一键启动预设模型服务,并快速完成DeepSeek推理集群的搭建。

依托于高效的文本推理框架xLLM和分布式系统的优化,该平台将TPOT(吐字间隔)缩短至20毫秒。在配置两台8卡H20的情况下,xLLM在DeepSeek-R1 671B模型上实现了4.5倍于开源SGLang方案的吞吐量提升(tokens/s),并且每个token的延迟降低至原来的三分之一。

基于自主研发的DiT推理框架veFuser,该平台在15秒内就能生成一个5秒的480P视频,相较于行业的平均水平,推理效率提高了4.5倍。

火山方舟还提供了全面的安全可信方案,涵盖链路全加密、数据高保密、环境强隔离和操作可审计等四个安全模块,确保会话过程中的信息不会留下痕迹。

火山方舟应用实验室为客户和开发者提供了一整套场景化解决方案和完整的源代码,涵盖应用插件、多模态和终端等多种场景,拥有超过20个开源应用。同时,面向具备专业开发能力的企业开发者,提供了大模型应用开发所需的工具和流程,支持快速开发和定制与业务场景相匹配的大模型应用,兼容超过60个大模型产品,使用户能轻松将方舟的大模型集成到主流软件中。

火山方舟应用实验室广场还展示了众多有趣的应用,如助力网店运营的智能导购、与DeepSeek协作的豆包模型长期记忆方案、结合多模态与硬件能力的实时对话AI硬件,以及提供标准化解题链路的教师分身等。

Data Agent助力企业发掘数据资产,新版Trae接入豆包深度思考模型

Data Agent是火山引擎推出的企业级数据智能体,犹如一个数字专家,具备主动思考、洞察、分析和行动能力,旨在帮助企业充分挖掘数据资产的价值,其功能涵盖数据分析、智能营销等多个关键领域。

在数据分析方面,Data Agent能够整合企业内部的结构化和非结构化数据,结合联网知识,迅速理解业务需求,并快速生成专业的深度研究报告。

通过自动化制定分析计划、追踪指标波动、使用自助分析工具和构建预警系统,Data Agent实现了数据处理的全流程智能化,将复杂报表的生成时间从两天缩短至30分钟,显著提高了数据获取和决策的效率。

在智能营销领域,Data Agent能够实现从策略的制定到执行优化的全链路闭环管理,精准高效地完成目标人群的选择和策略拆解,基于个性化引擎实现精准营销。

此外,其智能会话辅助及自动复盘优化功能,不断提升转化率和客户满意度,为营销策略的动态迭代提供支持。

五、豆包大模型产业落地加速,为游戏、医药行业拓界增效

豆包大模型已经在多个行业中取得显著成果,包括汽车、智能终端、互联网、金融、教育科研及零售消费等,覆盖了4亿个终端设备,涉及八成主流车企、70%的系统重要性银行,以及数十家证券基金公司。此外,近七成的C9顶级高校和100多家科研机构也在使用这一技术。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

在游戏行业方面,巨人网络正在利用大模型的优势来重新塑造游戏体验并进行玩法创新。通过火山方舟的接入,巨人网络今年3月在其游戏《太空杀》中推出了AI原生的“内鬼挑战”玩法。借助火山方舟DeepSeek-R1和豆包大模型的深度思考能力,开发团队创造了能够与真人玩家进行实时策略对抗的AI角色,从而重新定义了社交推理游戏的智能边界。

六、全链路与全场景的AI云原生推理系统,助力企业实现快速AI转型与升级

伴随着DeepSeek的逐步升温,火山引擎的MaaS流量也随之迎来了一波新的增长。目前,火山引擎的MaaS服务通过DeepSeek与豆包大模型,具备每日峰值千卡级GPU弹性能力、初始500万TPM(每分钟token数)、超过3万的RPM(每分钟请求数),日均Tokens使用量达到12.7万亿。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

火山引擎的AI云原生推理套件为这些能力提供了有力支持。

根据第三方评估排行榜,火山引擎的DeepSeek服务在首次token、推理速度及生成速度方面均展现出优异的表现。在相同硬件资源条件下,DeepSeek-R1的满血版相比开源SGLang,能够将TPS吞吐量提升5倍,并将GPU使用成本降低了80%。

火山引擎针对不同模型,提供了多种接入与使用方式,包括方舟MaaS平台、机器学习平台以及AI云原生推理套件。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

面向大模型推理的AI云原生推理套件ServingKit,能够帮助企业实现从模型部署到推理和运维的全链路效率提升。

在部署环节,镜像下载和加载的加速服务,使得首次部署和扩展阶段能够迅速启动业务,助力业务发展。Onion镜像权重加速引擎能够实现DeepSeek-R1满血版模型在109秒内完成下载、40秒内完成缓存预热,以及13秒内完成权重加载。

提升推理效率,助力AI发展

在推理阶段,借助GPU算子加速器、APIG AI网关、VKE编排调度及KVCache缓存服务等技术的升级,推理性能得到了显著优化。经过算子优化,R1满血版的TPS提升达2.4倍;智能路由的TTFT降低幅度高达60%;在长文本推理的场景下,KVCache的命中率相比于GPU Local提高了10倍。

在运维方面,观测平台APM与VMP进行了全面的升级,支持推理业务的无侵入式透明埋点,确保从资源层到推理业务层的全链路和全场景的指标观测得到覆盖。

火山引擎重磅更新:豆包视频生成新模型与视觉深度思考模型震撼发布,Trae功能全面升级!

火山引擎与英特尔携手合作,创新性地通过“云实例+镜像”的组合,提供了一个低门槛且高效率的大模型开发平台。未来,二者将继续致力于提升大模型的部署效率并降低算力成本。

结语:推动AI应用的广泛普及

火山引擎副总裁张鑫在分享中指出,企业在AI落地的过程中,应当清晰地走过业务价值、模型基础设施建设及智能体应用三个阶段。业务价值的实现是渐进的,首先需达成战略共识(-1→0),接着选择技术成熟、数据准备充分且业务价值突出的场景进行验证(0→1),在此过程中逐步构建自身的AI能力中心并积累企业知识库,为后续的扩展复制(1→N)及价值重构(N→∞)奠定基础。

在这一过程中,企业的核心竞争力来源于将AI融入产品设计中,以提供卓越的用户体验,同时积累独特的领域知识与专业模型,构建适应AI时代的人才组织和企业文化。

技术落地的旅程远不止是引入一个大模型,而是涵盖了多个维度,包括模型选择、效果评估、数据知识工程、算力准备、开发平台搭建等一系列环节。

火山引擎将通过更全面的模型矩阵和丰富的智能体工具,帮助企业打通业务与智能体之间的应用链路,进一步推动AI的普及,期待与更多企业携手,将AI科技的落地方式从以往的手动编写“Hello World”代码,转变为更加轻松的对Agent轻声问候“Hi”。

来源:今日头条
原文标题:火山引擎密集上新:豆包全新视频生成模型、视觉深度思考模型,Trae多个重点功能升级 - 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
广告也精彩

No comments

No comments...