说实话,即梦Seedance 2.0的理解能力真的强到有点离谱。
真正做到了,简单一两句话,出来的质量也不会太差。
不需要什么专业术语,不需要长篇大论,就几句自然语言,它就懂了。
从这个角度来说,提示词确实已经不是门槛了。
大部分场景下,你用日常说话的方式告诉它你想要什么,它都能给你一个至少七八十分的结果。
这就是Seedance2.0的厉害之处。
但我想说的是,更确定性的好,还是随机性的好,其实是两码事。
而且随机性的结果,会带来一个问题,就是“抽卡”。
也许你“抽中”的视频质量不错,但不一定是你想要的。
为什么会这样?
问题就出在了:你跟AI之间,差了一套语言。
当你说”高级感”,AI其实是不知道”高级”在视觉上到底长什么样。
想说”柔和的光”,AI也只是把光均匀地糊上去。
很多人爱跟AI说”电影感”,实际上AI调出来的,是一个见得最多的默认模板。
它不是不听话,它是真的不知道你具体想要什么。而在摄影和灯光行业里,这些东西是有精确语言的。
景别、焦段、光圈控制空间感;光线方向、衰减路径、反射填充控制光影层次;色温、色相分布、明暗比例控制色彩情绪。
这些倒不是什么高深概念,而是影视行业这么多年积累下来的一套视觉控制语言。
假如说我们把自己当作AI视频导演,那么,搭建自己的视觉语言系统,其实也只是为了,让AI这个“摄影师”更好地工作。
unsetunset第一章 认知基础:理解AI的视觉语言逻辑unsetunset
1.1 从”描述”到”指令”的思维转换
很多人写提示词的第一个困境,不是词汇量不够,而是思维方式错了。
你觉得自己在跟AI对话,其实AI根本没在”听”你说话。
你输入的每一个词,AI做的是拿它去匹配训练数据里的特征组合。
这就导致了一个根本性的差异:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
写提示词的第一步,不是学会”描述”得更好看,而是要懂得切换思维。
1.2 AI的三个常见行为
理解了上面这一点之后,你还需要知道AI有三个常见的”坏习惯”:
它会偷懒。
为了计算效率,AI会自动弱化它认为不重要的部分。提示词写了十个元素,后面四五个可能全被简化了。所以你经常发现提示词越长,后半段越不生效。
它会套模板。
发现你写的风格词它见过很多次,就直接调用训练数据里最典型的搭配。这就是为什么一加”电影感”,出来的图长得都差不多。
它会自己脑补。
你在提示词里没有覆盖到的部分,AI不会留白,它会自动从训练数据里调用最常见的默认搭配来填上去。没定义的光线、没限定的表情、没指定的构图,全部会被AI的默认值覆盖。
1.3 提示词的本质:约束AI的自由度
提示词做的,不是给AI灵感,而是给AI圈定一个“摄影”空间。
你什么都不写的时候,AI的生成空间无限大,结果完全随机——就是大家说的”抽卡”。
你每写一个有效的词,就是在某个维度上压缩AI的选择空间:
-
写了”特写” → 构图维度被锁定 -
写了”侧光” → 光线维度被约束 -
写了”低饱和” → 色彩维度被限制
写得越具体、越准确,AI能乱发挥的空间越少。
但前提是:你压缩的必须是”有效维度”。
“高级感””电影感”这种词,你觉得好像是在限制AI,但实际上啥也没限制住,AI的自由度跟没写一样大。
核心就一句话:写提示词不是做加法,是做减法——减掉AI的自由度,只留下你要的那条路。
换句话说,就是给提示词降噪,AI才能更容易听到你真正想要的画面。
unsetunset第二章 提示词核心方法论unsetunset
2.1 提示词结构公式:主体→光影→氛围
提示词有一个最基本的骨架——三段式:
|
|
|
|
|---|---|---|
| 最前面 |
|
|
| 中段 |
|
|
| 最后面 |
|
|
简单记:主体稳、光影准、氛围自然。 顺序别搞反了。
2.2 精简的艺术:减情绪词、减重复词、减叙述句
对大部分人来说,提示词写得越多,错得越多。真正让画面变好的不是加东西,而是砍东西。
第一刀,砍情绪词。
“高级感””电影感””唯美感”,对AI来说不是有效控制信息。
你现在写这些词出来效果还行,是因为模型变聪明了,不是词变精准了。
AI只是从大量可能里给你一个凑合的结果,本质还是抽卡。
第二刀,砍重复词。
“电影感””大片氛围””高级质感”,你感觉在加强,AI觉得你在重复。
这些相似的词不会叠加效果,只会分散权重。
每条信息只出现一次就够。
第三刀,砍叙述句。
“她轻轻推开门,走进洒满阳光的房间”,很有画面感,但AI不是在读小说。
它会把这段话拆成一堆零散的动作标签,没有主次。
提示词不要去写故事,而要写结构:
-
谁在动 -
怎么动 -
镜头是固定还是跟随
拆清楚就够了。
2.3 抽象词具象化:把”感觉”翻译成”参数”
这一部分是整套方法论的核心。
你脑子里有感觉,但AI不懂感觉。
“梦幻””孤独””压抑”在AI眼里只是一个模糊的语义标签,它不知道这些词对应什么画面,只能猜。
解决方法只有一个:
把抽象感觉翻译成AI能执行的视觉参数。
看一个例子:
意图:梦幻感
写法对比:
提示词 AI理解 差 “梦幻的场景,唯美氛围,高级感画面,柔和光线” 全是模糊标签,AI只能抽卡 好 “低饱和度色调,大光圈浅景深,背景大面积虚化,光源从左上方斜入,光线边缘柔和过渡,色温偏暖偏粉” 每一个词都是可执行的参数
其他常见抽象词的翻译:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
当你把抽象词拆成参数,画面就不再靠运气了。
2.4 负面提示词的分层策略
告诉AI”你不要什么”,和告诉它”你要什么”同样重要。
负面提示词不是把不想要的东西全塞进去就完了——它是分层的:
|
|
|
|
|---|---|---|
| 第一层 |
|
|
| 第二层 |
|
|
| 第三层 |
|
|
三层从底到高叠加,AI的发挥空间被逐层压缩,输出越来越稳定。
unsetunset第三章 摄影语言:让AI像摄影师一样工作unsetunset
3.1 景别与心理距离的对应关系
很多人在提示词里只描述内容——有什么人、什么场景。但你忽略了一个关键信息:镜头。
你不是在告诉AI”画面里有什么”,而是要试着告诉AI”这个画面怎么被拍出来的”。
景别决定的不是画面大小,而是观众和画面之间的心理距离:
|
|
|
|
|
|---|---|---|---|
| 远景 |
|
|
|
| 中景 |
|
|
|
| 特写 |
|
|
|
在提示词里写清楚景别,AI画面立刻就有”拍摄感”,而不是一张”AI生成的图”。
3.2 焦段、光圈与空间感控制
景别决定拍多远,焦段和光圈决定怎么拍。
焦段改变的不是清晰度,是透视结构:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
光圈控制虚化程度:
-
F1.4 → 极致虚化,只剩主体 -
F5.6 → 适度虚化,主次分明 -
F11 → 全景清晰,强调环境
在提示词里加上焦段和光圈值,AI自己就会按真实摄影逻辑来生成。
3.3 构图原则:位置、动线、平衡
构图的本质是给观众的视线规划路线。
主体位置 — AI默认用中心构图,安全但平淡,也是”AI味重”的常见原因。三分法偏移主体,画面立刻有呼吸感。
视觉动线 — 什么都不写,观众视线就是散的。在提示词里写清楚动线方向,AI就会顺着逻辑安排元素。
画面平衡 — 平衡不等于对称。靠颜色深浅、明暗对比、物体体量来分配视觉重量,不对称也能显得稳。
来看同一个意图在不同构图下的写法:
意图:”孤独的人站在城市中”
构图策略 提示词写法 画面效果 中心构图 “人站在城市街道中央,正面面对镜头” 工整但无情绪 三分法 “人物位于画面右侧1/3处,面朝左侧大面积城市负空间” 大量留白,孤独感自来 对角线 “俯拍视角,人物在左下角,建筑群沿对角线向右上延伸” 纵深拉开,渺小感扑面而来
同一个想法,不同构图,画面完全不是一个级别。
unsetunset第四章 光线与色彩:画面的灵魂密码unsetunset
4.1 光线控制:方向、层次、衰减、反射
光线是AI画面最容易露馅的地方。你觉得”假”但说不出来哪里假,十有八九是光线的问题。
光线的控制是四层递进逻辑:
方向 → 不能只写”柔和光线”。
要写光从哪个方向进来、阴影落在哪里、阴影边缘是硬还是软。方向定了,画面就有立体感。
层次 → AI默认把画面照得很满很均匀。
你要明确:主光在哪、补光多弱、暗部保留多少。光线有主次,情绪才有落点。
衰减 → AI不通过”亮度”理解光线,而是通过衰减路径推导亮度分布。
“柔光””弱光”这些感觉词基本没用。你要写:光照亮了哪个区域、在哪里开始减弱、在哪里消失。AI会根据这条路径自动拉开明暗差。
反射 → 真正让空间真实的不是直射光,而是光经过多次反射慢慢填亮空间。
写”光打到墙面被反射,反射光填充人物暗部”——写不写这一层,是”还行”和”很真实”之间的分水岭。
另外还有一个进阶概念——体积光。
光穿过空气中的微粒才会被看见(雾气里的光束、窗帘缝隙的光柱),写清楚”光从哪来、穿过了什么介质、形成怎样的光束”,氛围感直接拉满。
4.2 室内光与室外光的写法差异
写不好室内光线,是因为你在套室外光的写法,但在AI眼里这两套逻辑完全不同。
室外光源默认是太阳,不用声明。
但室内光不可能凭空出现——你不给光源实体,AI就自己瞎编一个,光线肯定假。
室内写光的正确链路:光源实体 → 衰减路径 → 反射填充
对比:
写法 问题 差 “柔和的室内光线,温暖的氛围” 全是感觉词,AI无法执行 好 见下 每一步都有物理逻辑 好的完整写法:
光源:午后阳光从画面左侧落地窗斜射入室内,色温偏暖 衰减:光线照亮窗边木质地板和部分墙面,距窗约两米处开始明显减弱,房间深处进入半暗状态 反射:地板反射的暖色光线微弱填充人物脸部下方和颈部暗区,墙角保留深色阴影
核心记住一点:室内光的重点不是”亮度控制”,而是你有没有把这个空间的光照逻辑讲清楚。
4.3 色彩参数化:从直觉到数据
“给我某某色彩风格”——AI收到的只是一个标签,只能猜。
要把审美直觉翻译成AI能执行的色彩数据,搞清楚三件事:
|
|
|
|
|---|---|---|
| 色温 |
|
|
| 明暗比例 |
|
|
| 色相分布 |
|
|
不要写”梦幻的蓝紫色调”,写”主色:
低饱和度冷蓝,辅色:微弱暖粉,去除绿色和黄色干扰”。
AI对参数级描述的执行力度完全不是一个量级。
unsetunset第五章 人物与动态:从静止到生动unsetunset
5.1 皮肤质感与微表情
人物是AI最容易露馅的地方,露馅最多的两个位置:皮肤和表情。
皮肤的关键——当材质写,不当效果写。
AI默认把皮肤当”需要被优化的视觉效果”来处理,拼命叠光泽、叠磨皮,结果就是油腻感。
正确做法:
-
在提示词里加入材质约束词,把皮肤从”审美层”拉回”材质层” -
光线结构化:强调面部明暗关系,不要让光均匀铺满脸 -
AI会先建立面部体积感,光不集中在一个平面上,皮肤自然不油
微表情的关键——三个要素缺一不可:
|
|
|
|
|---|---|---|
| 强度 |
|
|
| 动因 |
|
|
| 时序 |
|
|
比如”害羞”:不只是脸红,还有轻微低头、视线闪避、手指无意识揪衣角。
加上身体动作依托,AI才会构建完整姿态链,画面才脱离摆拍感。
5.2 动作提示词的正确写法
动作是另一个重灾区。堆动词看起来详细,但对AI来说是指令冲突。
核心原则:
-
减动词,增方式词 — 保留一个核心动作,用方式词限定节奏和状态(”缓慢地””犹豫地””重心前倾地”) -
一个主动作 — “走路中回头看”,主动作是walking,回头只是头部朝向变化,从属于主动作 -
状态替代顺序 — AI不会真正执行时间线,与其描述先后顺序,不如描述动作发生时角色处于什么状态
看一个具体对比:
意图:角色害羞地低头微笑
写法 问题 差 “女孩害羞,低头,微笑,双手交叉放身前,眼神闪避” 五个动词一起砸过来,AI不知道以哪个为核心 好 “女孩站立,主动作为轻微低头,面部朝画面偏下方,嘴角略微上扬但幅度克制,双手自然垂落、指尖轻触裙边,整体姿态内收” 一个主动作,其余都是状态补充
主次分明,画面就干净利落。
unsetunset第六章 工作流与分镜:系统化创作unsetunset
6.1 AI视频的时间逻辑与运动结构
AI视频不是”动起来的图片”,底层逻辑完全不同。
静态图只要一个瞬间,视频是时间中的连续运动。
只写”人物向前走去”,AI能动,但会非常僵硬——它没有得到任何运动节奏的信息。
视频提示词必须明确的:
-
动作的起始状态 -
持续时间和速度变化 -
运动过程中光线是否有变化(AI每一帧都在重新推断光照)
消除摆拍感的核心策略:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
核心理念:消除摆拍感不是让画面更复杂,而是让镜头变得”不那么聪明”。当你允许画面不完美,AI的假感才会消失。
6.2 工作流搭建的正确顺序
很多人搭工作流的第一步就错了——上来就写提示词,不断试错,流程越长效果越乱。
正确顺序是反过来的:
|
|
|
|
|---|---|---|
| 第一步 |
|
|
| 第二步 |
|
|
| 第三步 |
|
|
会搭工作流的人不是靠运气,而是靠复盘。
当你把AI创作从”碰运气”变成一套有逻辑的流程,才算真正掌握了这个工具。
6.3 分镜提示词
常规写视频提示词的方式是:一整段话从头描述到尾,”人物从左边走进来,看了看四周,然后坐下,镜头慢慢推近”。
写得很完整,但交给AI之后,画面的节奏、镜头的切换、每一秒具体展示什么,全部由AI自己决定。
这种情况下,AI确实做出来了,但节奏是均匀铺开的,没有轻重缓急。
分镜解决的就是这个问题:
你来决定每一秒在发生什么,镜头怎么走,画面看什么,怎么过渡到下一段。
分镜提示词的四个底层要素:
不管用哪种分镜写法,底层都是在回答四个问题:
|
|
|
|
|---|---|---|
| 时间切割 |
|
|
| 镜头动作 |
|
|
| 画面内容 |
|
|
| 转场方式 |
|
|
四个要素缺任何一个,那一段分镜就交给了AI的默认行为。
镜头动作的常用词汇:
这些是分镜写作中最高频的镜头控制词,写分镜时直接调用:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
四种分镜写法,看场景选用:
第一种:时间码式分镜
按秒数把视频切成段落,每一段写明时间范围和对应画面。
结构:X-X秒:镜头动作 + 画面内容 + 转场
示例(15秒产品展示视频):
0-2秒:快速闪切四个产品款式的特写,每个定格约0.5秒,强调材质光泽 3-6秒:特写产品核心卖点的细节,镜头缓慢推近,展示工艺质感 7-12秒:快速切换三个使用场景,每个场景3-4秒,人物与产品互动 13-15秒:产品居中陈列,镜头缓慢拉远至全景,底部出现品牌文字
适合:广告、产品展示、MV——任何对节奏要求严格的场景。时间码让AI对每一段的时长有精确预期,节奏最可控。
第二种:镜头叙事式分镜
不用秒数,用镜头动作的自然切换来划分段落。
结构:镜头A做什么 → 镜头B做什么 → 镜头C做什么
示例(追逐场景):
镜头跟随人物从背后跟拍,穿过狭窄的走廊 镜头转为侧面跟拍,人物撞倒路边障碍物爬起来继续跑 镜头从跟随视角环绕到人物正面,拍摄气喘吁吁的表情 镜头急停,右摇180度,展示前方的分岔路口 拉远至俯拍全景,人物在画面中逐渐变小
适合:故事片、剧情向视频、动作场景。不锁定具体秒数,让AI根据动作的自然节奏来分配时间,更灵活,但节奏控制力比时间码式弱一些。
第三种:时间码参考图
先准备好每一段对应的参考图,提示词里用时间码 + @参考图 + 镜头动作三合一。
结构:X-X秒:描述内容,参考@图片X
示例(8秒动漫片段):
0-3秒:女主转身坐下,下了一步棋并说台词,画面参考@图片1和@图片2 3-4秒:快速摇镜头,转向对面男人面部特写,参考@图片3 4-6秒:切镜头,俯拍,对面的人们惊叹,参考@图片4 6-8秒:镜头迅速向下摇,画面黑屏转场后渐亮,女人看着窗外说台词,参考@图片5
适合:需要每一格画面都精准匹配预设风格的场景。控制力最强,但准备工作最多——你需要先有分镜图。好消息是,分镜图本身可以用AI图片生成工具来制作。
第四种:九宫版参考图
前三种写法都需要你在提示词里写清楚每一段的细节。
但Seedance 2.0的多模态理解能力确实强大,就是实在不想学那么概念,写那么多话,你可以用九宫图分镜。
做法:
-
用AI图片工具生成你视频的关键画面 -
把这些关键帧按顺序排成一张3×3的九宫格图 -
上传这张九宫图作为参考,提示词只写一句话
示例:
参考素材:一张九宫格图,9个格子按顺序展示视频的9个关键画面节点
提示词:”参考@图片1的九宫格分镜,按从左到右、从上到下的顺序演绎,整体风格为电影质感的叙事短片”
九宫格本身携带了大量信息,构图、色彩、角色造型、场景变化、景别——这些全部由图片传达,不再需要你逐一用文字描述。
Seedance 2.0会自动从画面中提取视觉逻辑,你的一句话只需要告诉它顺序和基调。
九宫图分镜 vs 详细文字分镜,怎么选?
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
大部分日常创作,九宫图分镜已经足够。
只有当你对节奏要求非常严格(比如商业广告卡点、MV),才需要用详细文字分镜去逐秒控制。
转场方式速查:
分镜写的是每一段”在发生什么”,但段和段之间”怎么过渡”同样影响成片质量。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
不写转场方式,AI默认硬切。
硬切不一定差,但如果你的视频需要流畅感或情绪过渡,主动指定转场方式差别很大。
分镜的本质是什么?
不是把视频切碎,而是把你对每一秒的控制意图写清楚。
没有分镜的提示词,AI在规定时间里自己安排所有事情,你只能看最终结果满不满意。
有分镜的提示词,你规定了第几秒看什么、镜头怎么动、怎么过渡到下一段——AI只负责在你画好的框架里填充画面。
控制力的差别,就是”碰运气”和”按计划出片”的差别。
unsetunset附录:AI提示词核心概念速查手册unsetunset
A. 情绪与氛围类
|
|
|
|
|
|---|---|---|---|
| 情绪浓度 |
|
|
|
| 抽象词具象化 |
|
|
|
| 情绪来源 |
|
|
|
| 时态引导 |
|
|
|
B. 光线与色彩类
|
|
|
|
|
|---|---|---|---|
| 光线方向 |
|
|
|
| 光线衰减路径 |
|
|
|
| 反射填充 |
|
|
|
| 体积光 |
|
|
|
| 色温 |
|
|
|
| 色相分布 |
|
|
|
| 光比 |
|
|
|
C. 摄影与构图类
|
|
|
|
|
|---|---|---|---|
| 景别 |
|
|
|
| 焦段 |
|
|
|
| 光圈 |
|
|
|
| 三分法 |
|
|
|
| 负空间 |
|
|
|
| 视觉动线 |
|
|
|
| 透视引导词 |
|
|
|
D. 人物与动作类
|
|
|
|
|
|---|---|---|---|
| 材质约束词 |
|
|
|
| 微表情强度 |
|
|
|
| 表情动因 |
|
|
|
| 主动作 |
|
|
|
| 方式词 |
|
|
|
| 状态约束 |
|
|
|
E. 进阶机制类
|
|
|
|
|
|---|---|---|---|
| AI的理解偏差 |
|
|
|
| 跑偏连锁反应 |
|
|
|
| 风格串味 |
|
|
|
| 可控失控 |
|
|
|
| 注意力引导词 |
|
|
|
| 因果暗示 |
|
|
|
| 负面提示词分层 |
|
|
|
| 注意力权重分配 |
|
|
|
F. 视频与工作流类
|
|
|
|
|
|---|---|---|---|
| 时间与动作关系 |
|
|
|
| 镜头起点偏移 |
|
|
|
| 响应延迟 |
|
|
|
| 工作流搭建 |
|
|
|
- 1本网站所有模板均为龙视觉团队设计制作,未经授权禁止用于任何商业用途。
- 2本网站主要发布内容Avee音乐模板AE可视化模板,教程,软件,图片等
- 3转载或引用本站内容请注明出处,尊重原创,共同维护良好的创作环境。
- 4网站评论区欢迎理性讨论,请勿发表违反法律法规的言论,共建和谐社区。
- 5如有内容侵犯您的权益,请通过博客联系方式告知,将立即核实并处理。
- 6使用本站资源网盘失效时,请在留言板反应。

唐宝模板B站
龙视觉B站演示
模板演示抖音号
模板演示快手号













请登录后发表评论
注册