🚀 HunyuanVideo 1.5 使用指南


更新

本指南将指导您掌握从基础的文生视频、图生视频,到进阶的风格、氛围、运镜和光线控制等技巧,即使在不借助额外的Prompt 改写模型的情况下,也可以写出高级的prompt指令,实现优质生成效果,从而全面释放您的创意。

官网:

github: https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5

huggingface: https://huggingface.co/tencent/HunyuanVideo-1.5

user guide english version:

一、  基础功能

文生视频

功能介绍:输入一段文字,模型即可生成对应的视频。为了更精确地控制画面,我们强烈建议您使用结构化的提示词。您可以像专业人士一样,将多个“***”组合起来。

核心公式: 提示词= 主体+ 运动+ 场景+ [景别] + [运镜] + [光线] + [风格] + [氛围],一个好的提示词可以由以上部分自由组合而成,后边括号[]中的几项为可选项。

● 基础用法: 主体+ 运动+ 场景

● 进阶用法: 自由添加更多控制标签,如:主体+ 运动+ 场景+ 风格+ 运镜+ 光线

提示词示例:

一朵蘑菇从草丛中长了出来。

一段电影摄影风格的逼真视频展示了一个白色石膏半身像在慢动作中破碎,露出3D文字

图生视频

功能介绍:上传「一张图片+ 一段文字指令」,将对应生成一段视频。视频的第一帧来自上传的图片,后面帧的内容将按照文字指令生成。

核心公式:提示词= 主体动态变化+ 场景动态变化+ [运镜]

提示词示例:

画面中的女孩缓缓抬起头,目光定在画面的右上方。镜头随着她的目光移动,逐渐展现出一扇洛可可风格的窗户,窗框上装饰着精美的雕刻和金线,玻璃反射着室内柔和的光线。女孩的头巾和耳环随着她的动作微微晃动,衣领的边缘也随着她的动作微妙地起皱。

二、进阶控制

1.  风格控制

您可以通过风格相关关键词去控制生成视频整体的画面风格。

● 写实/电影风格

一位留着胡须的中年侦探,穿着风衣、戴着软呢帽,站在倾盆大雨中的城市街道上。此时已是深夜,背景中是一家挂着明亮红蓝霓虹灯招牌的酒吧。镜头以中景慢慢拉近。灯光主要来自路灯和霓虹灯,在他的脸上和湿透的风衣上投下高对比度的阴影。整体效果呈现出电影黑色电影风格,营造出一种忧郁、神秘和悬疑的氛围。

2.  光线控制

● 核心原则: 光是氛围的灵魂。学会描述光,就能控制视频的情绪。

● 常用光线描述技巧:

○ 照明风格:(例如,柔和、硬、霓虹灯光)

○ 光线方向:(例如,自上而下、侧光)

○ 光线质量:(例如,柔和、刺眼、聚光灯)

○ 阴影细节:(例如,深阴影、柔和渐变、高对比度)

○ 色温:(例如,温暖的黄金时段、凉爽的日光,黄金时刻)

○ 反射:(例如,水、玻璃或金属表面上的反射光)

○ 剪影和轮廓:(例如,主体背光,创造戏剧性的轮廓,逆光/剪影)

示例:

黄昏时分,一名运动员沿着河岸进行训练。太阳即将落山,这“黄金时刻”的光线极为柔和,呈暖黄色,为他奔跑的身躯镀上一层金边,营造出充满活力与希望的画面。

3.  运镜控制

通过在提示词中加入标准的运镜关键词,可以显著提升画面的电影感。可以参考以下标准术语

参考运镜词库

运镜类型

***

说明

基础移动

相机向上/下移动

垂直升降拍摄

相机向左/右平移

水平横移拍摄

推拉镜头

相机推近

镜头推进

相机拉远

镜头后退

角度调整

相机向上/下倾斜

仰视或俯视调整

相机向左/右摇摄

绕轴横向左/右旋转

环绕/旋转

相机环绕

围绕主体拍摄

相机360度旋转

全方位环绕

特殊模式

相机跟随拍摄

锁定主体移动

相机静止

固定机位

 4.  视频内中英双语文字渲染

HunyuanVideo 1.5 可以在视频画面中生成清晰、高质感的文字。

● 使用方法: 在您的提示词中,使用引号将您希望生成的文字包围起来。

● 中文提示词: 请使用中文双引号“”。

● 英文提示词: 请使用英文双引号""。

5.  更多进阶控制和说明

1)  支持语言: 当前支持中文英文的提示词输入。

2)  视频尺寸: 支持16:9 (横屏)、4:3、1:1 (方形)、3:4、9:16 (竖屏) 多种画幅比例。请在生成前设置。

3)  保持简洁: 尽量使用简单、直接的词汇和语法结构。

4)  提示词组件详解:

组件

描述

示例

主体

视频的核心对象。可描述其外观、穿着、发型、物种等。

一个穿着红色连衣裙、黑色长发的亚洲女性、一只可爱的布偶猫

运动

主体正在做的动作或所处的状态。应清晰、直接。

正在奔跑、专注地打字、缓慢地行走、喝了一口咖啡

场景

主体所处的环境背景

在夜晚的城市街道上、在厨房里、在草地上、在月球表面

景别

视频的镜头类型,用于突出或强调特定的视觉内容。

航拍镜头、特写镜头、中景镜头、远景镜头

运镜

镜头的运动方式。

参考上述运镜词库

光线

描述视频的光线情况。

参考上述光线描述技巧

风格

视频的视觉风格类型。

写实风格、赛博朋克风格、科幻风格、像素艺术风格、水墨画等

氛围

视频的整体情绪和调子。

温暖的、紧张的、神秘的、电影感

 

5)  为了让视频功能响应更准确更有动感,推荐按照如下要求,把提示词写的更具体可响应:

● 动态化与时序性

规则: 将画面描述为一个有时间顺序的过程,使用连接词明确步骤。

推荐句式: 先…… 然后…… 接着…… 同时…… 最后……

示范: 女孩先整理一下头发,然后转身走向门口,最后停在门前回头看向镜头。

● 客观描述细节

规则: 减少使用抽象的情绪词,将其转化为“动作细节”。

公式: 主体+ 动作+ 小细节

示范: 男孩嘴角露出微笑,眼睛微微弯起。

● 空间与方位的精确化

规则: 用简单的方位词明确“谁在哪里”以及“往哪里动”。

方位词库: 画面左侧/右侧、上方/下方、中间、前景/背景。

示范: 一只手从画面右侧伸出,摸了摸黑色衣服上的吊牌,然后从画面下方离开画面。

● 指代关系清晰

规则: 当画面有多个角色时(包括图生视频的输入图像),建议用属性或位置区分个体,避免混淆。

示范: 黑猫把手里的炸弹递给灰猫,灰猫接过炸弹后转身向画面右侧跑去。

 

三、  更多创意用法和案例

1.  强指令响应

原生支持中英文长文本输入,可解析复杂语义(如光影、构图等),自动映射至视频参数,支持连续运镜、文字渲染、动作组合及多样指令生成。

示例:徒步旅行者开始沿着小径向前走,使得水瓶随着每一步有节奏地摆动。相机逐渐拉远并升起,展现出一片广阔的沙漠景观延伸至前方,同时太阳的位置从午后逐渐移向黄昏,随着画面中的人物变小,地形上的阴影也越来越长。

2.  流畅运动生成

生成人物与物体运动流畅自然,无畸变,遵循物理规律,涵盖快速镜头与动态场景。

3.  物理规律遵循

可精准生成柔性自然现象和刚性物理效果,赋予场景沉浸式的真实感与生命力。

4.  跨次元生成

HunyuanVideo 1.5 支持跨次元生成,可将虚拟世界的角色和元素(如卡通人物、特效)无缝地引入并融入真实场景。模型能够精准解析复杂的语义、光影和材质纹理,确保虚拟元素在现实环境中具有沉浸式的真实感,实现虚拟与现实的自然融合。

示例:镜头保持静止,然后慢慢拉近,聚焦于前景中真实人类的手与背景电脑屏幕上的卡通角色美少女战士之间的互动。屏幕上的美少女战士保持着施法的姿势,眼睛直视前方,嘴角挂着一丝微笑。接着,美少女战士缓缓伸出右手,从屏幕中探出来,手臂跨越虚拟与现实的界限,进入前景空间。她的手悬停在真实人类手掌上方,投射出清晰的倒影。然后,美少女战士的手指轻轻触碰手掌; 接触瞬间,皮肤上出现银色星光印记,随后开始闪烁,频率逐渐降低直至完全消失。虚拟角色的手与真实人类的手在空间位置和视觉层次上无缝融合,呈现出统一的视觉效果。

5.  动作逻辑与分解

HunyuanVideo 1.5 支持动作逻辑分解、通过描述主体的动作分解状态以及使用特定的视觉词汇来生成复杂动作。

核心公式:提示词= 场景设定+ 时序动作分解+ 关键细节

示例:固定、静态俯拍镜头,画面中一棵树干的照片平放在木桌上。

动作分解:

1、一只真实的人手进入画面,将一枚松塔放在照片上的树洞旁,手迅速退出画面。

2、一只逼真的3D松鼠从照片中的2D树洞里钻了出来。松鼠出来时空着爪子。

3、松鼠嗅了嗅纸上的松果,一脸好奇,眨了眨眼,歪了歪头。

4、松鼠伸出爪子,从桌子上抓起那颗松果。

关键细节:现实世界与照片的无缝互动,超现实的视觉特效,松鼠爪子最初空空如也,松果给人以沉重的视觉感受。

0