
Creatify 团队
分享
在本文中
Seedance 2.0,ByteDance 的最先进视频生成模型,现在已可在 Creatify 的资产生成器 中使用。它是我们推出的更重要的模型新增之一:原生音频、多镜头一致性,以及在一次生成中实现电影级镜头控制。
原生音频、多镜头序列与电影级镜头控制

Seedance 2.0 接受文本、图片、视频片段和音频作为输入,并从一次生成中产出带同步声音的多镜头视频。
它比大多数视频模型多做了几件事:
音频与视频同时生成。 音乐、对白、环境音和音效一次生成即可输出,并与画面同步。无需单独进行音频叠加。只要在提示词里描述你想听到的内容(“欢快的背景音乐”、“人群噪音”、“雨声”),模型就会处理好。
跨镜头的人物一致性。 上传一张参考图,脸部、服装和视觉风格就能在每个场景中保持一致。你的产品和演员在第 3 个镜头里看起来和第 1 个镜头里一样。
真正可用的镜头语言。 变焦拉推、焦点切换、跟拍镜头、POV 视角切换。用直白的话写出镜头运动,Seedance 2.0 就能执行。
每次生成最多可输入 12 个参考素材。 你可以把 9 张图片、3 段视频片段和 3 段音频片段与文本提示词一起组合输入。这意味着你可以直接喂给它现成的产品照片、品牌视频素材或音频参考,而不是从零开始提示。

为什么它对广告创意有用
大多数视频模型只会生成单个片段。产品广告片或叙事型广告需要多个镜头能够连贯拼接。Seedance 2.0 正是为此而生:人物一致、镜头衔接自然,以及跨剪辑始终同步的音频。
一次生成音频的部分也能压缩后期制作时间。完成一支广告通常意味着先做视频剪辑,再单独做音频。用了 Seedance 2.0,这两步可以合并为同一步。

在输出质量方面:ByteDance 使用内部基准测试(SeedVideoBench-2.0)将 Seedance 2.0 与 Sora 2 Pro、 Veo 3.1 和 Kling 3.0 进行了对比。在运动质量、音画同步和音频表现力方面,Seedance 2.0 在他们的评估中领先。这些是 ByteDance 自己的基准,而不是独立测试,但在实际使用中输出表现依然很能打。
片段每个镜头最长 15 秒,最高支持 2K 分辨率。这足以用于 YouTube、高清社交媒体内容以及 CTV 投放。
如何使用
打开 资产生成器,选择 Seedance 2.0,然后输入提示词或上传你的参考素材。你可以在同一次生成中混合产品图片、视频片段和音频。

常见问题
什么是 Seedance 2.0?
ByteDance 最先进的视频生成模型。它可从一次生成中,基于文本、图片、视频和音频输入,产出带原生音频且人物一致的多镜头视频。
Creatify 的哪个方案包含 Seedance 2.0?
它可在 资产生成器 工具中使用。
它和资产生成器中的其他模型有什么不同?
大多数模型只会生成单个片段。Seedance 2.0 支持带同步音频的多镜头序列,因此更适合需要多个场景协同工作的产品广告和叙事广告。
我可以使用自己的产品图片或素材吗?
可以。你可以在一次生成中,将最多 9 张图片、3 段视频片段和 3 段音频片段与文本提示词组合使用。
片段有多长?
每个镜头最长 15 秒。通过串联多个镜头构建更长的序列,同时在剪辑之间保持人物和视觉一致性。
Seedance 2.0,ByteDance 的最先进视频生成模型,现在已可在 Creatify 的资产生成器 中使用。它是我们推出的更重要的模型新增之一:原生音频、多镜头一致性,以及在一次生成中实现电影级镜头控制。
原生音频、多镜头序列与电影级镜头控制

Seedance 2.0 接受文本、图片、视频片段和音频作为输入,并从一次生成中产出带同步声音的多镜头视频。
它比大多数视频模型多做了几件事:
音频与视频同时生成。 音乐、对白、环境音和音效一次生成即可输出,并与画面同步。无需单独进行音频叠加。只要在提示词里描述你想听到的内容(“欢快的背景音乐”、“人群噪音”、“雨声”),模型就会处理好。
跨镜头的人物一致性。 上传一张参考图,脸部、服装和视觉风格就能在每个场景中保持一致。你的产品和演员在第 3 个镜头里看起来和第 1 个镜头里一样。
真正可用的镜头语言。 变焦拉推、焦点切换、跟拍镜头、POV 视角切换。用直白的话写出镜头运动,Seedance 2.0 就能执行。
每次生成最多可输入 12 个参考素材。 你可以把 9 张图片、3 段视频片段和 3 段音频片段与文本提示词一起组合输入。这意味着你可以直接喂给它现成的产品照片、品牌视频素材或音频参考,而不是从零开始提示。

为什么它对广告创意有用
大多数视频模型只会生成单个片段。产品广告片或叙事型广告需要多个镜头能够连贯拼接。Seedance 2.0 正是为此而生:人物一致、镜头衔接自然,以及跨剪辑始终同步的音频。
一次生成音频的部分也能压缩后期制作时间。完成一支广告通常意味着先做视频剪辑,再单独做音频。用了 Seedance 2.0,这两步可以合并为同一步。

在输出质量方面:ByteDance 使用内部基准测试(SeedVideoBench-2.0)将 Seedance 2.0 与 Sora 2 Pro、 Veo 3.1 和 Kling 3.0 进行了对比。在运动质量、音画同步和音频表现力方面,Seedance 2.0 在他们的评估中领先。这些是 ByteDance 自己的基准,而不是独立测试,但在实际使用中输出表现依然很能打。
片段每个镜头最长 15 秒,最高支持 2K 分辨率。这足以用于 YouTube、高清社交媒体内容以及 CTV 投放。
如何使用
打开 资产生成器,选择 Seedance 2.0,然后输入提示词或上传你的参考素材。你可以在同一次生成中混合产品图片、视频片段和音频。

常见问题
什么是 Seedance 2.0?
ByteDance 最先进的视频生成模型。它可从一次生成中,基于文本、图片、视频和音频输入,产出带原生音频且人物一致的多镜头视频。
Creatify 的哪个方案包含 Seedance 2.0?
它可在 资产生成器 工具中使用。
它和资产生成器中的其他模型有什么不同?
大多数模型只会生成单个片段。Seedance 2.0 支持带同步音频的多镜头序列,因此更适合需要多个场景协同工作的产品广告和叙事广告。
我可以使用自己的产品图片或素材吗?
可以。你可以在一次生成中,将最多 9 张图片、3 段视频片段和 3 段音频片段与文本提示词组合使用。
片段有多长?
每个镜头最长 15 秒。通过串联多个镜头构建更长的序列,同时在剪辑之间保持人物和视觉一致性。














