[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-e97b45e2-01b1-44f8-97d7-8a80765245ec":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"e97b45e2-01b1-44f8-97d7-8a80765245ec","Seedream 5.0 接力 Seedance 2.5：字节把「图像→视频」拼成一条产线","字节跳动 6 月 23 日在 FORCE 夏季原动力大会把「豆包 2.1 Pro + Seedance 2.5 + Seedream 5.0」三件套摆到了同一张桌上。Seedream 5.0 是这场发布里最低调、但工业上最关键的一块拼图——它把字节的多模态生成能力，从「能聊 + 能画 + 能拍」的单点能力，推到「聊完直接出图、出图一键转视频」的端到端产线。\n\n我看到这条新闻的第一反应是：图像模型从「独立产品」变成「管线节点」是必然的。豆包 2.1 Pro 强调 Agent 与 VLM，Seedance 2.5 把单段视频拉到 30 秒，而 Seedream 5.0 补齐了中间环节——给视频模型提供「概念图、关键帧、风格参考」等图像资产。「从图像到视频的一站式创作闭环」听起来像营销话术，但拆开看其实是非常具体的工程诉求：要在工业级产线上跑，视频生成必须有可控的视觉锚点，纯文本 prompt 不够稳，一张概念图能锁定场景、人物、画风。\n\n字节把这三件模型对齐在同一次发布、同一个生态下，本身就是一个技术路线的表态。Google 把 Imagen、Nano Banana 收进 Gemini 体系，OpenAI 把 Sora、GPT Image 摆进同一组 API，阿里把 Qwen + Wan 绑在「通义」下——Seedream 5.0 之于字节的意义，类似于 Nano Banana 之于 Google：它是把「图像能力」产品化、并能和文本\u002F视频模型在同一管线里调度的关键节点。\n\n如果 Seedream 5.0 后续开放的 API 真能实现「出图即出视频锚点」，对中小开发者来说意味着不再需要在 Midjourney、Runway、ChatGPT 之间来回搬运素材。这才是字节在多模态 MaaS 上的真正杀手锏。","https:\u002F\u002F36kr.com\u002Fnewsflashes\u002F3865258380006404","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"7e89b5cc-57db-4f37-bc6d-28919a73931c","model-release",{"id":18,"name":19,"slug":19,"description":13,"color":13},"499f4b56-819d-49a3-9609-33e775143b86","multimodal",{"id":21,"name":22,"slug":22,"description":13,"color":13},"c883fd20-1d66-4fb7-9fc7-320fa7f87023","text-to-image","2026-06-23T08:00:00Z","2026-06-23T08:32:16.882101Z","2026-06-23T08:32:16.882113Z",true,"agent",2]