视频生成 2.5:一句话生成声音与画面,升级你的创作力
核心亮点:通过提示词描述即可生成声音,实现音画高度同步。
模型特性:
● 音画同步:原生支持音画同步、高保真音频生成,含人声(多人)、ASMR、音效、音乐等多种声音类型,支持中文、英文、小语种和方言。可通过提示词指定生成音频,或上传音频作为参考。
● 10s长视频生成:最高支持 10s 视频,容量提升一倍,叙事更完整。
● 指令遵循提升:大幅提升自然语言理解和指令遵循能力,理解复杂连续变化指令控制,运镜理解,支持结构化提示词
● 视频质量优化:动态表现力与结构稳定性显著提升,电影级美学,最高 1080P / 24fps 输出。
● 图生视频保ID优化:语义控制精准,角色与元素一致性更高。
● 通用音频驱动:文生/图生视频均支持音频参考生成,搭配提示词或首帧图创作更丰富画面。
暂时还没有关联作品| 类型 | Checkpoint |
| 发布时间 | 2025-09-23 |