Seedance 2.0提示词体系课：搭建一套属于自己的视觉语言系统（万字收藏版）龙视觉资源网-10年坚持初心依旧龙视觉资源网

说实话，即梦Seedance 2.0的理解能力真的强到有点离谱。

真正做到了，简单一两句话，出来的质量也不会太差。

不需要什么专业术语，不需要长篇大论，就几句自然语言，它就懂了。

从这个角度来说，提示词确实已经不是门槛了。

大部分场景下，你用日常说话的方式告诉它你想要什么，它都能给你一个至少七八十分的结果。

这就是Seedance2.0的厉害之处。

但我想说的是，更确定性的好，还是随机性的好，其实是两码事。

而且随机性的结果，会带来一个问题，就是“抽卡”。

也许你“抽中”的视频质量不错，但不一定是你想要的。

为什么会这样？

问题就出在了：你跟AI之间，差了一套语言。

当你说”高级感”，AI其实是不知道”高级”在视觉上到底长什么样。

想说”柔和的光”，AI也只是把光均匀地糊上去。

很多人爱跟AI说”电影感”，实际上AI调出来的，是一个见得最多的默认模板。

它不是不听话，它是真的不知道你具体想要什么。而在摄影和灯光行业里，这些东西是有精确语言的。

景别、焦段、光圈控制空间感；光线方向、衰减路径、反射填充控制光影层次；色温、色相分布、明暗比例控制色彩情绪。

这些倒不是什么高深概念，而是影视行业这么多年积累下来的一套视觉控制语言。

假如说我们把自己当作AI视频导演，那么，搭建自己的视觉语言系统，其实也只是为了，让AI这个“摄影师”更好地工作。

unsetunset第一章认知基础：理解AI的视觉语言逻辑unsetunset

1.1 从”描述”到”指令”的思维转换

很多人写提示词的第一个困境，不是词汇量不够，而是思维方式错了。

你觉得自己在跟AI对话，其实AI根本没在”听”你说话。

你输入的每一个词，AI做的是拿它去匹配训练数据里的特征组合。

这就导致了一个根本性的差异：

你感觉的	实际发生的
你在描述一幅画面	AI在执行一条指令
你脑子里有画面、情绪、光线	AI只看到几个需要拼接的语义标签
你在做加法——堆越多越好	AI在做概率匹配——越精准越好

写提示词的第一步，不是学会”描述”得更好看，而是要懂得切换思维。

1.2 AI的三个常见行为

理解了上面这一点之后，你还需要知道AI有三个常见的”坏习惯”：

它会偷懒。

为了计算效率，AI会自动弱化它认为不重要的部分。提示词写了十个元素，后面四五个可能全被简化了。所以你经常发现提示词越长，后半段越不生效。

它会套模板。

发现你写的风格词它见过很多次，就直接调用训练数据里最典型的搭配。这就是为什么一加”电影感”，出来的图长得都差不多。

它会自己脑补。

你在提示词里没有覆盖到的部分，AI不会留白，它会自动从训练数据里调用最常见的默认搭配来填上去。没定义的光线、没限定的表情、没指定的构图，全部会被AI的默认值覆盖。

1.3 提示词的本质：约束AI的自由度

提示词做的，不是给AI灵感，而是给AI圈定一个“摄影”空间。

你什么都不写的时候，AI的生成空间无限大，结果完全随机——就是大家说的”抽卡”。

你每写一个有效的词，就是在某个维度上压缩AI的选择空间：

写了”特写” → 构图维度被锁定
写了”侧光” → 光线维度被约束
写了”低饱和” → 色彩维度被限制

写得越具体、越准确，AI能乱发挥的空间越少。

但前提是：你压缩的必须是”有效维度”。

“高级感””电影感”这种词，你觉得好像是在限制AI，但实际上啥也没限制住，AI的自由度跟没写一样大。

核心就一句话：写提示词不是做加法，是做减法——减掉AI的自由度，只留下你要的那条路。

换句话说，就是给提示词降噪，AI才能更容易听到你真正想要的画面。

unsetunset第二章提示词核心方法论unsetunset

2.1 提示词结构公式：主体→光影→氛围

提示词有一个最基本的骨架——三段式：

位置	写什么	为什么
最前面	主体信息	AI注意力权重最高，主体才会清晰完整
中段	光影信息	AI会参考前面的主体来分配光线，光自然落在对的地方
最后面	氛围/风格词	放前面容易被当成全局指令破坏结构，放末尾只做微调

简单记：主体稳、光影准、氛围自然。 顺序别搞反了。

2.2 精简的艺术：减情绪词、减重复词、减叙述句

对大部分人来说，提示词写得越多，错得越多。真正让画面变好的不是加东西，而是砍东西。

第一刀，砍情绪词。

“高级感””电影感””唯美感”，对AI来说不是有效控制信息。

你现在写这些词出来效果还行，是因为模型变聪明了，不是词变精准了。

AI只是从大量可能里给你一个凑合的结果，本质还是抽卡。

第二刀，砍重复词。

“电影感””大片氛围””高级质感”，你感觉在加强，AI觉得你在重复。

这些相似的词不会叠加效果，只会分散权重。

每条信息只出现一次就够。

第三刀，砍叙述句。

“她轻轻推开门，走进洒满阳光的房间”，很有画面感，但AI不是在读小说。

它会把这段话拆成一堆零散的动作标签，没有主次。

提示词不要去写故事，而要写结构：

谁在动
怎么动
镜头是固定还是跟随

拆清楚就够了。

2.3 抽象词具象化：把”感觉”翻译成”参数”

这一部分是整套方法论的核心。

你脑子里有感觉，但AI不懂感觉。

“梦幻””孤独””压抑”在AI眼里只是一个模糊的语义标签，它不知道这些词对应什么画面，只能猜。

解决方法只有一个：

把抽象感觉翻译成AI能执行的视觉参数。

看一个例子：

意图：梦幻感

写法对比：

提示词

AI理解

差
“梦幻的场景，唯美氛围，高级感画面，柔和光线”

全是模糊标签，AI只能抽卡

好
“低饱和度色调，大光圈浅景深，背景大面积虚化，光源从左上方斜入，光线边缘柔和过渡，色温偏暖偏粉”

每一个词都是可执行的参数

	提示词	AI理解
差	“梦幻的场景，唯美氛围，高级感画面，柔和光线”	全是模糊标签，AI只能抽卡
好	“低饱和度色调，大光圈浅景深，背景大面积虚化，光源从左上方斜入，光线边缘柔和过渡，色温偏暖偏粉”	每一个词都是可执行的参数

其他常见抽象词的翻译：

你想要的感觉	翻译成视觉参数
孤独感	人物在画面边缘 + 大量留白 + 主体被环境压缩 + 冷灰色调
高级感	光线对比明确 + 局部留白 + 色彩克制统一 + 去除杂乱细节
压抑感	大面积暗部 + 只有一小块光打在主体上 + 空间被压缩
电影感	中长焦镜头 + 摄影约束参数 + 明暗对比分明 + 色彩统一

当你把抽象词拆成参数，画面就不再靠运气了。

2.4 负面提示词的分层策略

告诉AI”你不要什么”，和告诉它”你要什么”同样重要。

负面提示词不是把不想要的东西全塞进去就完了——它是分层的：

层级	否定什么	作用
第一层	否定材质	排除塑料质感、过度光滑、不真实反光，稳住画面底子
第二层	否定生成路径	阻止AI默认套路：自动美颜、自动堆饱和度、过度渲染
第三层	否定确定性结果	排除你不想要的最终风格，防止流于模板

三层从底到高叠加，AI的发挥空间被逐层压缩，输出越来越稳定。

unsetunset第三章摄影语言：让AI像摄影师一样工作unsetunset

3.1 景别与心理距离的对应关系

很多人在提示词里只描述内容——有什么人、什么场景。但你忽略了一个关键信息：镜头。

你不是在告诉AI”画面里有什么”，而是要试着告诉AI”这个画面怎么被拍出来的”。

景别决定的不是画面大小，而是观众和画面之间的心理距离：

景别	画面特征	适合的情绪	提示词关键
远景	人物小，环境占主导	渺小、孤独、宿命感	不用写”孤独”，远景自带情绪
中景	最接近社交距离	叙事感、日常感	能看清动作又能感知环境
特写	情绪放大器	共情、紧张、压迫感	没有铺垫会显生硬，慎用

在提示词里写清楚景别，AI画面立刻就有”拍摄感”，而不是一张”AI生成的图”。

3.2 焦段、光圈与空间感控制

景别决定拍多远，焦段和光圈决定怎么拍。

焦段改变的不是清晰度，是透视结构：

焦段	视觉效果	适合场景
广角（如24mm）	夸张近大远小，空间被拉扯	对峙、压迫、侵略感
中焦（如50mm）	最接近人眼透视	日常、自然、叙事
长焦（如85-135mm）	压缩前后距离，空间扁平统一	“高级”电影画面

光圈控制虚化程度：

F1.4 → 极致虚化，只剩主体
F5.6 → 适度虚化，主次分明
F11 → 全景清晰，强调环境

在提示词里加上焦段和光圈值，AI自己就会按真实摄影逻辑来生成。

3.3 构图原则：位置、动线、平衡

构图的本质是给观众的视线规划路线。

主体位置 — AI默认用中心构图，安全但平淡，也是”AI味重”的常见原因。三分法偏移主体，画面立刻有呼吸感。

视觉动线 — 什么都不写，观众视线就是散的。在提示词里写清楚动线方向，AI就会顺着逻辑安排元素。

画面平衡 — 平衡不等于对称。靠颜色深浅、明暗对比、物体体量来分配视觉重量，不对称也能显得稳。

来看同一个意图在不同构图下的写法：

意图：”孤独的人站在城市中”

构图策略

提示词写法

画面效果

中心构图

“人站在城市街道中央，正面面对镜头”

工整但无情绪

三分法

“人物位于画面右侧1/3处，面朝左侧大面积城市负空间”

大量留白，孤独感自来

对角线

“俯拍视角，人物在左下角，建筑群沿对角线向右上延伸”

纵深拉开，渺小感扑面而来

构图策略	提示词写法	画面效果
中心构图	“人站在城市街道中央，正面面对镜头”	工整但无情绪
三分法	“人物位于画面右侧1/3处，面朝左侧大面积城市负空间”	大量留白，孤独感自来
对角线	“俯拍视角，人物在左下角，建筑群沿对角线向右上延伸”	纵深拉开，渺小感扑面而来

同一个想法，不同构图，画面完全不是一个级别。

unsetunset第四章光线与色彩：画面的灵魂密码unsetunset

4.1 光线控制：方向、层次、衰减、反射

光线是AI画面最容易露馅的地方。你觉得”假”但说不出来哪里假，十有八九是光线的问题。

光线的控制是四层递进逻辑：

方向 → 不能只写”柔和光线”。

要写光从哪个方向进来、阴影落在哪里、阴影边缘是硬还是软。方向定了，画面就有立体感。

层次 → AI默认把画面照得很满很均匀。

你要明确：主光在哪、补光多弱、暗部保留多少。光线有主次，情绪才有落点。

衰减 → AI不通过”亮度”理解光线，而是通过衰减路径推导亮度分布。

“柔光””弱光”这些感觉词基本没用。你要写：光照亮了哪个区域、在哪里开始减弱、在哪里消失。AI会根据这条路径自动拉开明暗差。

反射 → 真正让空间真实的不是直射光，而是光经过多次反射慢慢填亮空间。

写”光打到墙面被反射，反射光填充人物暗部”——写不写这一层，是”还行”和”很真实”之间的分水岭。

另外还有一个进阶概念——体积光。

光穿过空气中的微粒才会被看见（雾气里的光束、窗帘缝隙的光柱），写清楚”光从哪来、穿过了什么介质、形成怎样的光束”，氛围感直接拉满。

4.2 室内光与室外光的写法差异

写不好室内光线，是因为你在套室外光的写法，但在AI眼里这两套逻辑完全不同。

室外光源默认是太阳，不用声明。

但室内光不可能凭空出现——你不给光源实体，AI就自己瞎编一个，光线肯定假。

室内写光的正确链路：光源实体 → 衰减路径 → 反射填充

对比：

写法

问题

差
“柔和的室内光线，温暖的氛围”

全是感觉词，AI无法执行

好
见下

每一步都有物理逻辑

好的完整写法：

光源：午后阳光从画面左侧落地窗斜射入室内，色温偏暖

衰减：光线照亮窗边木质地板和部分墙面，距窗约两米处开始明显减弱，房间深处进入半暗状态

反射：地板反射的暖色光线微弱填充人物脸部下方和颈部暗区，墙角保留深色阴影

	写法	问题
差	“柔和的室内光线，温暖的氛围”	全是感觉词，AI无法执行
好	见下	每一步都有物理逻辑

核心记住一点：室内光的重点不是”亮度控制”，而是你有没有把这个空间的光照逻辑讲清楚。

4.3 色彩参数化：从直觉到数据

“给我某某色彩风格”——AI收到的只是一个标签，只能猜。

要把审美直觉翻译成AI能执行的色彩数据，搞清楚三件事：

参数	控制什么	举例
色温	画面的情绪底色	偏冷=清晨感；偏暖=傍晚感
明暗比例	画面的视觉重量	高光多=通透轻盈；暗部多=沉稳厚重
色相分布	画面的统一感	限定主色+辅色，删掉干扰色

不要写”梦幻的蓝紫色调”，写”主色：

低饱和度冷蓝，辅色：微弱暖粉，去除绿色和黄色干扰”。

AI对参数级描述的执行力度完全不是一个量级。

unsetunset第五章人物与动态：从静止到生动unsetunset

5.1 皮肤质感与微表情

人物是AI最容易露馅的地方，露馅最多的两个位置：皮肤和表情。

皮肤的关键——当材质写，不当效果写。

AI默认把皮肤当”需要被优化的视觉效果”来处理，拼命叠光泽、叠磨皮，结果就是油腻感。

正确做法：

在提示词里加入材质约束词，把皮肤从”审美层”拉回”材质层”
光线结构化：强调面部明暗关系，不要让光均匀铺满脸
AI会先建立面部体积感，光不集中在一个平面上，皮肤自然不油

微表情的关键——三个要素缺一不可：

要素	说明	不写会怎样
强度	情绪有程度，不是开关	默认拉到最大值，微笑变咧嘴大笑
动因	表情要伴随身体变化	AI生成”被刻意摆出来的表情”，很假
时序	微表情是变化过程，不是最终状态	出来的是”截图脸”而不是正在发生的画面

比如”害羞”：不只是脸红，还有轻微低头、视线闪避、手指无意识揪衣角。

加上身体动作依托，AI才会构建完整姿态链，画面才脱离摆拍感。

5.2 动作提示词的正确写法

动作是另一个重灾区。堆动词看起来详细，但对AI来说是指令冲突。

核心原则：

减动词，增方式词 — 保留一个核心动作，用方式词限定节奏和状态（”缓慢地””犹豫地””重心前倾地”）
一个主动作 — “走路中回头看”，主动作是walking，回头只是头部朝向变化，从属于主动作
状态替代顺序 — AI不会真正执行时间线，与其描述先后顺序，不如描述动作发生时角色处于什么状态

看一个具体对比：

意图：角色害羞地低头微笑

写法

问题

差
“女孩害羞，低头，微笑，双手交叉放身前，眼神闪避”

五个动词一起砸过来，AI不知道以哪个为核心

好
“女孩站立，主动作为轻微低头，面部朝画面偏下方，嘴角略微上扬但幅度克制，双手自然垂落、指尖轻触裙边，整体姿态内收”

一个主动作，其余都是状态补充

	写法	问题
差	“女孩害羞，低头，微笑，双手交叉放身前，眼神闪避”	五个动词一起砸过来，AI不知道以哪个为核心
好	“女孩站立，主动作为轻微低头，面部朝画面偏下方，嘴角略微上扬但幅度克制，双手自然垂落、指尖轻触裙边，整体姿态内收”	一个主动作，其余都是状态补充

主次分明，画面就干净利落。

unsetunset第六章工作流与分镜：系统化创作unsetunset

6.1 AI视频的时间逻辑与运动结构

AI视频不是”动起来的图片”，底层逻辑完全不同。

静态图只要一个瞬间，视频是时间中的连续运动。

只写”人物向前走去”，AI能动，但会非常僵硬——它没有得到任何运动节奏的信息。

视频提示词必须明确的：

动作的起始状态
持续时间和速度变化
运动过程中光线是否有变化（AI每一帧都在重新推断光照）

消除摆拍感的核心策略：

策略	操作	原理
改变镜头起点	从不完整的视角开始，让镜头自己”找到”画面	真实摄影中镜头一定有寻找过程
引入节奏变化	推进中短暂减速或轻微停顿	制造人为操作的痕迹
制造响应延迟	让人物先动，摄像机过一会儿再跟上	时间差让画面变成”被记录的瞬间”

核心理念：消除摆拍感不是让画面更复杂，而是让镜头变得”不那么聪明”。当你允许画面不完美，AI的假感才会消失。

6.2 工作流搭建的正确顺序

很多人搭工作流的第一步就错了——上来就写提示词，不断试错，流程越长效果越乱。

正确顺序是反过来的：

步骤	做什么	关键
第一步	理清思路	要解决什么问题？目标是什么？流程应该怎么工作？
第二步	结构化提示词	提示词在工作流里只是一个模块，不是核心
第三步	测试+反推错误点	结果不对先反推哪一步出问题，别第一时间改提示词

会搭工作流的人不是靠运气，而是靠复盘。

当你把AI创作从”碰运气”变成一套有逻辑的流程，才算真正掌握了这个工具。

6.3 分镜提示词

常规写视频提示词的方式是：一整段话从头描述到尾，”人物从左边走进来，看了看四周，然后坐下，镜头慢慢推近”。

写得很完整，但交给AI之后，画面的节奏、镜头的切换、每一秒具体展示什么，全部由AI自己决定。

这种情况下，AI确实做出来了，但节奏是均匀铺开的，没有轻重缓急。

分镜解决的就是这个问题：

你来决定每一秒在发生什么，镜头怎么走，画面看什么，怎么过渡到下一段。

分镜提示词的四个底层要素：

不管用哪种分镜写法，底层都是在回答四个问题：

要素	要回答的问题	不写会怎样
时间切割	这一段占多少秒？	AI自己均分，节奏平淡
镜头动作	镜头在做什么？跟拍、推近、还是固定？	AI用最安全的默认运镜
画面内容	谁在画面里、在做什么？	AI自己安排，可能跟你想的完全不同
转场方式	这一段怎么结束、怎么过渡到下一段？	AI直接硬切，没有节奏感

四个要素缺任何一个，那一段分镜就交给了AI的默认行为。

镜头动作的常用词汇：

这些是分镜写作中最高频的镜头控制词，写分镜时直接调用：

镜头动词	含义	适合什么场景
跟随/跟拍	镜头跟着人物移动	追逐、行走、穿越空间
推近/推进	镜头向主体靠近	强调细节、制造压迫感
拉远	镜头远离主体展示全景	收尾、揭示环境
摇镜头	镜头原地转动（左/右/上/下）	在不同角色或物体间切换
环绕	镜头围绕主体旋转	展示全貌、营造气场
固定镜头	镜头不动，人物在画面内活动	对话场景、稳定叙事
切镜	直接跳切到另一个视角	节奏加速、强调
一镜到底	从头到尾不切镜头	连贯叙事、沉浸感

四种分镜写法，看场景选用：

第一种：时间码式分镜

按秒数把视频切成段落，每一段写明时间范围和对应画面。

结构：X-X秒：镜头动作 + 画面内容 + 转场

示例（15秒产品展示视频）：

0-2秒：快速闪切四个产品款式的特写，每个定格约0.5秒，强调材质光泽

3-6秒：特写产品核心卖点的细节，镜头缓慢推近，展示工艺质感

7-12秒：快速切换三个使用场景，每个场景3-4秒，人物与产品互动

13-15秒：产品居中陈列，镜头缓慢拉远至全景，底部出现品牌文字

适合：广告、产品展示、MV——任何对节奏要求严格的场景。时间码让AI对每一段的时长有精确预期，节奏最可控。

第二种：镜头叙事式分镜

不用秒数，用镜头动作的自然切换来划分段落。

结构：镜头A做什么 → 镜头B做什么 → 镜头C做什么

示例（追逐场景）：

镜头跟随人物从背后跟拍，穿过狭窄的走廊

镜头转为侧面跟拍，人物撞倒路边障碍物爬起来继续跑

镜头从跟随视角环绕到人物正面，拍摄气喘吁吁的表情

镜头急停，右摇180度，展示前方的分岔路口

拉远至俯拍全景，人物在画面中逐渐变小

适合：故事片、剧情向视频、动作场景。不锁定具体秒数，让AI根据动作的自然节奏来分配时间，更灵活，但节奏控制力比时间码式弱一些。

第三种：时间码参考图

先准备好每一段对应的参考图，提示词里用时间码 + @参考图 + 镜头动作三合一。

结构：X-X秒：描述内容，参考@图片X

示例（8秒动漫片段）：

0-3秒：女主转身坐下，下了一步棋并说台词，画面参考@图片1和@图片2

3-4秒：快速摇镜头，转向对面男人面部特写，参考@图片3

4-6秒：切镜头，俯拍，对面的人们惊叹，参考@图片4

6-8秒：镜头迅速向下摇，画面黑屏转场后渐亮，女人看着窗外说台词，参考@图片5

适合：需要每一格画面都精准匹配预设风格的场景。控制力最强，但准备工作最多——你需要先有分镜图。好消息是，分镜图本身可以用AI图片生成工具来制作。

第四种：九宫版参考图

前三种写法都需要你在提示词里写清楚每一段的细节。

但Seedance 2.0的多模态理解能力确实强大，就是实在不想学那么概念，写那么多话，你可以用九宫图分镜。

做法：

用AI图片工具生成你视频的关键画面
把这些关键帧按顺序排成一张3×3的九宫格图
上传这张九宫图作为参考，提示词只写一句话

示例：

参考素材：一张九宫格图，9个格子按顺序展示视频的9个关键画面节点

提示词：”参考@图片1的九宫格分镜，按从左到右、从上到下的顺序演绎，整体风格为电影质感的叙事短片”

九宫格本身携带了大量信息，构图、色彩、角色造型、场景变化、景别——这些全部由图片传达，不再需要你逐一用文字描述。

Seedance 2.0会自动从画面中提取视觉逻辑，你的一句话只需要告诉它顺序和基调。

九宫图分镜 vs 详细文字分镜，怎么选？

	九宫图分镜	详细文字分镜
适合	有明确视觉参考、追求效率	需要精确控制每一秒的节奏
控制力	中等——AI自己决定节奏和转场	强——每一段你来定
准备工作	生成关键帧，拼成一张图	写完整的分段提示词
提示词量	一句话	完整分段描述
核心优势	省力，视觉信息量远超文字	节奏、转场、镜头动作全可控

大部分日常创作，九宫图分镜已经足够。

只有当你对节奏要求非常严格（比如商业广告卡点、MV），才需要用详细文字分镜去逐秒控制。

转场方式速查：

分镜写的是每一段”在发生什么”，但段和段之间”怎么过渡”同样影响成片质量。

转场方式	怎么写	效果
直接切	“切镜””切到”	最快速，适合节奏紧凑的段落
动作转场	“人物走出画面→下一段人物出现”	自然过渡，叙事连贯
黑屏转场	“画面黑屏，后渐亮”	时间跳跃、情绪转换
遮罩转场	“主体飞过时，背后显现文字/下一场景”	广告常用，有设计感
无缝转场	“海浪冲刷变成飘动的窗帘”	高级，场景无缝衔接，一镜到底常用
特效转场	“粒子破碎/拼图碎裂后进入下一画面”	视觉冲击力强

不写转场方式，AI默认硬切。

硬切不一定差，但如果你的视频需要流畅感或情绪过渡，主动指定转场方式差别很大。

分镜的本质是什么？

不是把视频切碎，而是把你对每一秒的控制意图写清楚。

没有分镜的提示词，AI在规定时间里自己安排所有事情，你只能看最终结果满不满意。

有分镜的提示词，你规定了第几秒看什么、镜头怎么动、怎么过渡到下一段——AI只负责在你画好的框架里填充画面。

控制力的差别，就是”碰运气”和”按计划出片”的差别。

unsetunset附录：AI提示词核心概念速查手册unsetunset

A. 情绪与氛围类

概念	含义	什么时候用	怎么写
情绪浓度	情绪在画面中的集中程度和强弱	想让画面有情绪但不过度夸张时	把情绪集中在主体附近，其余区域保持克制
抽象词具象化	把”感觉”翻译成AI能执行的视觉参数	每次想写”高级感””梦幻”等词时	拆成色彩+光线+构图+材质的具体描述
情绪来源	让AI知道情绪从何而来，而不是直接写结果	需要画面有故事感和自然情绪时	写”稀疏光线+冷色调”而不是”孤独”
时态引导	用过去/现在/将来时态改变画面的时间感	想让静态画面有时间流逝感时	加入”刚刚””正在””即将”等时间状态词

B. 光线与色彩类

概念	含义	什么时候用	怎么写
光线方向	光从哪个角度进入画面	任何需要光线的场景（几乎每次）	明确光的入射角度+阴影位置+阴影软硬
光线衰减路径	光从最亮处到消失的过渡轨迹	室内场景、需要空间层次时	写光照亮哪里→在哪减弱→在哪消失
反射填充	光打到物体表面后反弹填亮暗部	想让空间真实、有呼吸感时	写光打到什么表面→反射光照亮哪个暗区
体积光	光穿过介质（雾气、灰尘）形成可见光束	需要强氛围感的场景	写光源+穿过的介质+形成的光束形态
色温	画面整体偏冷还是偏暖	需要设定画面情绪基调时	冷色温=清冷疏离，暖色温=温馨亲切
色相分布	画面中主色和辅色的搭配关系	想让画面色彩统一、有高级感时	限定1个主色+1个辅色，删除干扰色
光比	画面中最亮和最暗区域的对比程度	控制画面的视觉重量和情绪浓度时	高光比=戏剧化，低光比=柔和日常

C. 摄影与构图类

概念	含义	什么时候用	怎么写
景别	镜头拍摄的远近范围	控制观众与画面的心理距离时	远景/中景/特写，根据情绪需要选择
焦段	镜头的焦距参数，影响透视结构	需要画面有特定空间感时	广角(24mm)=夸张感，长焦(85mm)=高级统一感
光圈	控制背景虚化程度	需要区分主次关系时	F1.4=极致虚化，F11=全景清晰
三分法	将画面分成3×3网格，主体放在交叉点	默认构图太死板、需要呼吸感时	写主体在画面1/3或2/3位置
负空间	画面中主体以外的大面积空白区域	需要表达渺小、孤独、留白感时	写”大面积留白”或”环境占画面主导”
视觉动线	引导观众视线在画面中的移动路径	画面元素多、需要引导阅读顺序时	写”视线从XX沿XX方向延伸至主体”
透视引导词	用语言暗示空间纵深关系	想加强空间感和纵深冲击时	用方向延伸词、密度变化词、尺度对比词

D. 人物与动作类

概念	含义	什么时候用	怎么写
材质约束词	把皮肤当物理材质描述，而非审美效果	皮肤看起来油腻或塑料感时	用材质词替代美感词，拉回材质层
微表情强度	控制表情的幅度大小	需要自然、克制的人物表情时	先限定情绪幅度（”微微””轻微””略”）
表情动因	给表情一个发生的原因和身体伴随变化	表情看起来像”摆出来的”时	加上伴随的半身动作和身体细微变化
主动作	一个动作提示词中唯一的核心动作	写任何动作场景时（必须遵守）	永远只有一个主动作，其余从属于它
方式词	限定动作节奏和状态的修饰词	动作看起来僵硬或不协调时	“缓慢地””犹豫地””重心前倾地”
状态约束	用状态描述替代时间顺序描述	AI不按你写的先后顺序执行时	描述”角色处于什么状态”而非”先做A再做B”

E. 进阶机制类

概念	含义	什么时候用	怎么写
AI的理解偏差	AI对你的词理解成了另一个意思	生成结果和预期完全不同时	直接告诉AI”不要什么”，或把词拆成可量化描述
跑偏连锁反应	AI误解一个词后用错误逻辑推导后续画面	画面整体跑偏但不知是哪一步出错时	在重点词旁边加限定词锁定方向，防止AI自由推演
风格串味	AI在你没写清楚的地方偷偷加入自带的默认效果	画面出现你没写过的滤镜或风格时	明确指定参考风格类型，分段写提示词，设定优先级
可控失控	让AI在可控范围内稍微偏离默认路径	画面太工整太模板化、需要自然感时	把构图从精确值换成趋势词，用多光源制造犹豫感
注意力引导词	不描述画面内容但改变AI注意力分配的词	主体过度优化或抽象词被夸张化时	在关键位置插入引导词分散AI注意力
因果暗示	用假设的因果关系引导AI补全画面	想让AI自动补齐符合逻辑的细节时	先写结果，再补一句原因，AI会顺着结果把画面整理完整
负面提示词分层	分三层叠加否定词逐步压缩AI生成空间	画面风格不稳定或总出现不想要的效果时	第一层否材质→第二层否路径→第三层否结果
注意力权重分配	提示词中越靠前的词对AI影响力越大	安排提示词语序时（每次都要考虑）	最重要的写最前面，渐次递减

F. 视频与工作流类

概念	含义	什么时候用	怎么写
时间与动作关系	视频中动作必须有起始、持续、速度变化	写视频提示词时	明确运动的起始状态+节奏+加减速
镜头起点偏移	让视频从不完整的视角开始	视频有”摆拍感”时	初始帧用前景遮挡或构图偏移，让镜头去”找”画面
响应延迟	让人物动作先于镜头跟随	视频镜头和人物动作太同步、太假时	人物先动，摄像机晚一拍再跟上
工作流搭建	把AI创作组织成可复用的系统化流程	需要批量产出或稳定产出时	先理清思路→结构化提示词→测试反推错误