文章总结: 豆包大模型2.1正式发布,包含Pro和Turbo两个型号,在Agent、Coding、VLM三类场景下实现性能提升,支持复杂任务交付和多模态处理。视频生成模型Seedance2.0升级支持原生4K,Seedance2.5支持30秒生成长度和50个参考素材输入。图像模型Seedream5.0Pro优化信息呈现和编辑能力,音频模型1.0支持多模态参考生成影视级音频。 综合评分: 85 文章分类: 产品介绍,AI安全,解决方案
豆包大模型2.1发布,视频、图像、音频模型同步上新
激发创造丰富生活 激发创造丰富生活
字节跳动技术团队
2026年6月23日 19:50 北京
在小说阅读器读本章
去阅读
在今天召开的火山引擎Force原动力大会上,豆包大模型2.1正式发布,Coding和Agent场景下表现均有大幅提升。豆包视频生成模型Seedance 2.0同步升级 ,支持原生4K,Seedance 2.5、豆包图像创作模型Seedream 5.0 Pro、豆包音频生成模型1.0也首次亮相。
一、豆包大模型2.1
面向真实生产力场景的全新智能体
豆包大模型2.1包含Pro和Turbo两个型号,在Agent、Coding、VLM三类场景下实现了性能提升:
- 通用Agent能力显著提升,进一步强化跨工具、跨环境的任务交付能力。在面对高经济价值的办公任务和个人生活的复杂咨询时,可稳定完成项目规划、文件处理、工具调用等多步骤任务,产出可落地的结果。
- 提升了Coding的端到端交付能力,可在真实企业级开发任务中完成需求理解、功能实现、Bug修复、运行环境搭建和结果验证等任务,形成稳定交付。
- 多模态理解、知识、推理等基础能力进一步提升,对复杂视觉信息和视频内容处理更准确,为Agentic场景、代码工程和前沿探索提供基础支撑。
在检验模型真实工程能力和生产场景任务完成能力的多项权威测评集中,豆包2.1 Pro都有着极具竞争力的表现,得分接近或超越GPT 5.5和Claude Opus 4.7。此外,豆包2.1 Pro在多模态理解和GUI Agent能力上继续保持全球领先水准。
从左到右:Agent、Coding、VLM能力测试。滑动查看更多
目前,豆包大模型2.1已经在火山引擎上线,面向企业和开发者开放API,并陆续接入了豆包、TRAE、扣子等应用。更多模型技术细节详见:https://seed.bytedance.com/seed2_1
二、Seedance再升级
为实体产业创造价值
当Seedance 2.0深入到各行业生产流程,企业和创作者对模型生成视频的画质、时长、素材参考数量以及可控编辑等能力提出了更高的要求。
目前,Seedance 2.0正式升级,支持原生4K,实现了更细腻的细节呈现、更稳定的动态画面、更丰富的色彩表现,已通过火山引擎对外开放。
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
字节跳动技术团队已关注
分享视频
,时长00:12
0/0
00:00/00:12
切换到横屏模式
继续播放
[ ]
进度条,百分之0
播放
00:00
/
00:12
00:12
倍速
全屏
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
豆包大模型2.1发布,视频、图像、音频模型同步上新
观看更多
转载
,
豆包大模型2.1发布,视频、图像、音频模型同步上新
字节跳动技术团队已关注
分享点赞在看
已同步到看一看写下你的评论
视频详情
全新的Seedance 2.5在成片时长、多参考能力、视频编辑方面都实现了新的突破。目前,模型仍在内测中,预计7月初正式上线。
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
字节跳动技术团队已关注
分享视频
,时长02:36
0/0
00:00/02:36
切换到横屏模式
继续播放
[ ]
进度条,百分之0
播放
00:00
/
02:36
02:36
倍速
全屏
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
豆包大模型2.1发布,视频、图像、音频模型同步上新
观看更多
转载
,
豆包大模型2.1发布,视频、图像、音频模型同步上新
字节跳动技术团队已关注
分享点赞在看
已同步到看一看写下你的评论
视频详情
- 单段视频生成最长达30秒:叙事空间更充足,镜头表达更连贯,创作效率和成品品质大幅提升。
- 最多支持50个全模态参考素材输入:一次性输入角色设定、场景参考、实拍片段和脚本分镜等参考素材,在人物形象、画面风格和内容逻辑的理解上保持一致,同时保证生成过程中的稳定性。
- 更可控的视频生成与编辑:在保持画面一致性的同时,实现对局部内容的编辑,生成结果真正可修改、可迭代、可交付。
伴随着能力提升,Seedance 2.5将在具身智能、工业制造、自动驾驶等实体产业中发挥更多作用,为数据生成、场景仿真、流程演示和训练评测提供新的工具能力。视频生成技术对物理世界的深度理解,成为了“世界模型”的实现路径之一。
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
字节跳动技术团队已关注
分享视频
,时长00:27
0/0
00:00/00:27
切换到横屏模式
继续播放
[ ]
进度条,百分之0
播放
00:00
/
00:27
00:27
倍速
全屏
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
豆包大模型2.1发布,视频、图像、音频模型同步上新
观看更多
转载
,
豆包大模型2.1发布,视频、图像、音频模型同步上新
字节跳动技术团队已关注
分享点赞在看
已同步到看一看写下你的评论
视频详情
三、豆包图像创作模型Seedream 5.0 Pro
向复杂和深度前进
豆包图像创作模型Seedream 5.0 Pro在高密度、多层级信息的准确呈现方面进行了大幅优化,同时提供了交互式的精准编辑能力和多图层分离能力,还原生支持英语、西班牙语在内的14种语言文字生成,并自动适应每种语言的文化语境、排版习惯和字体形态。
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
字节跳动技术团队已关注
分享视频
,时长00:35
0/0
00:00/00:35
切换到横屏模式
继续播放
[ ]
进度条,百分之0
播放
00:00
/
00:35
00:35
倍速
全屏
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
豆包大模型2.1发布,视频、图像、音频模型同步上新
观看更多
转载
,
豆包大模型2.1发布,视频、图像、音频模型同步上新
字节跳动技术团队已关注
分享点赞在看
已同步到看一看写下你的评论
视频详情
探测器外观、发射到着陆的关键阶段由Seedream 5.0 Pro生成
该模型将于近期上线,为大家带来更丰富的创作体验。
四、豆包音频生成模型1.0
影视级成品音频直出
豆包音频生成模型1.0支持参考生成,输入文本、图片、音频任一模态的参考素材,均可端到端生成目标音频。此外,模型能够在长程生成中保持多角色音色的一致性,同时兼顾情绪、方言口音、背景音乐、环境氛围音以及拟音特效,一次直出影视级成品音频。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:字节跳动技术团队 激发创造丰富生活 激发创造丰富生活《豆包大模型2.1发布,视频、图像、音频模型同步上新》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论