很多人用 AI 作图/做视频,最大的卡点并不是模型不行,而是——不知道该怎么“说清楚”自己想要什么。
同样一个想法,有的人一句话就能出好图,有的人堆了几十个词却依然翻车,差别往往只在提示词的结构和表达方式。
这篇《通用提示词写法》帮你建立一套“把画面拆解成语言”的通用逻辑:
一、万能提示词公式
基础结构:主体 + 背景/环境 + 构图/镜头 + 风格 + 画质/参数
示例:
精灵女王的肖像,发光森林背景,体积光与薄雾,近景特写,浅景深,幻想风格,细节丰富,电影照明,高清

二、每一部分怎么写
- 主体(画面主角):人物/动物/物体是什么?长相、年龄感、服装、表情、动作、材质等
- 例:短发少女,白色连衣裙,微笑,手拿咖啡杯
- 背景/环境(氛围与世界观):场景、季节、天气、光线、色调、辅助元素
- 例:秋日公园,金色落叶,夕阳逆光,暖色调
- 构图/镜头(决定“高级感”):景别、机位、视角、焦段、景深、主体位置
- 例:半身像,三分构图,85mm,浅景深,背景虚化
- 风格(决定“画风”):写实/插画/动漫/赛博/古风等;如模型支持也可加艺术风格标签
- 提醒:如果模型没有训练某些风格词,单靠风格关键词可能效果有限
- 画质/参数(增强质感):高细节、清晰对焦、电影光、4K、质感皮肤、纹理等
- 提醒:最终细节主要受出图尺寸影响;适当提高尺寸比堆“超细节”词更有效
三、强调与权重(括号 / 数值)
强调提示词用于控制某些信息出现的“优先级/强度”。
- 圆括号 `( )`:每层括号把权重提高到原来的 1.1 倍
- 例:`(golden light)`、`((golden light))`
- 方括号 `[ ]`:每层括号把权重降低到原来的 0.9 倍
- 例:`[freckles]`(弱化雀斑)
- 直接写数值:`(关键词:1.3)`
- 例:`(brown beret:1.2)`、`(autumn leaves:1.1)`
建议范围:
- 权重通常建议控制在 0.5–1.5 之间;极端值(如 10、50)可能造成画面失真或崩坏。
四、示例模板
4.1 写真类
秋日公园里的亚洲女性,棕色贝雷帽,格纹外套,长发,手拿咖啡杯,半身像,三分构图,85mm,浅景深,夕阳暖光,背景金色落叶虚化,写实摄影,清晰对焦,高细节

4.2 插画/二次元
赛博朋克少女,霓虹街道,雨夜反光,动态姿势,夸张透视,强对比光影,二次元插画风,线条干净,色彩鲜艳,高细节

4.3 产品/电商
香水瓶产品摄影,纯色背景,顶侧柔光,高级质感玻璃与高光,干净画面,商业摄影,清晰对焦,细节纹理

五、让AI用提示词“动起来”(动作/角度/景别/运镜)
5.1 让画面动起来的 4 个来源(越具体越稳)
- 主体动作:谁在动?怎么动?方向/速度/幅度/节奏是什么?
- 例:缓慢转头看向镜头,轻轻微笑;抬手拨开刘海;向前走两步停下
- 环境动态:风、雨、雾、光影、粒子、衣摆/头发、车流、人群
- 例:gentle wind, leaves falling, rain droplets, fog drifting, dust particles
- 镜头运动(运镜):镜头怎么走,走多快,走多远
- 例:slow dolly in(慢推),orbit(环绕),tracking shot(跟拍)
- 对焦/景深变化:用“拉焦”制造电影感(很多模型更吃这套)
- 例:rack focus from foreground to subject(从前景拉到主体)
5.2 一句话公式
主体 + 场景 + 动作 +(景别+角度+焦段+景深)+ 运镜 + 光影/风格 + 稳定性约束
可复制模板(中英混写):
`[主体与场景],[主体动作],[环境动态],[景别/角度/焦段/景深],[运镜+速度],[光影/风格/画质],[稳定性约束/负面]`
5.3 “不同角度”写提示词:同一场景的 3 种写法
同一画面:雨夜霓虹街头,一个人撑伞走来
动作视角(更强调发生了什么):
雨夜霓虹街头,一个人撑伞向镜头走来,雨滴打在伞面,地面反光,步伐稳定,衣角轻摆,cinematic, smooth
- 镜头视角(更强调怎么拍):
雨夜霓虹街头,wide shot,low angle,35mm,deep depth of field,tracking shot following the subject,neon reflections,cinematic
- 氛围视角(更强调情绪与质感):
雨夜、霓虹、潮湿空气、强对比光影、冷色调,bokeh highlights,soft mist,slow movement,film look
5.4 角度/机位速查(Angle)
- 平视:eye-level
- 仰拍:low angle / worm’s-eye view(贴地仰视)
- 俯拍:high angle
- 顶拍:top-down / overhead
- 鸟瞰:bird’s-eye view(高空俯视)
- 主观视角:POV
- 过肩镜头:over-the-shoulder(OTS)
- 侧面轮廓:profile / side view
- 倾斜镜头:Dutch angle / canted angle(紧张感)
5.5 景别速查(Shot size)
- 极远景:extreme wide shot(EWS / ELS)
- 远景:wide shot(WS)
- 全景:full shot(FS)
- 中景:medium shot(MS)
- 中近景:medium close-up(MCU)
- 近景:close-up(CU)
- 特写:extreme close-up(ECU)
5.6 焦段/镜头速查(Lens)
- 超广角 14–24mm:空间夸张、冲击力强、适合大场景/近距离运动
- 广角 24–35mm:环境叙事强、街拍感/电影感常用
- 标准 50mm:自然、不容易畸变,通用稳
- 人像 85mm:更“电影人像”,背景更虚
- 长焦 135mm+:压缩空间、远处特写、背景更贴近
- 微距:macro lens(适合产品细节/质感)
景深/对焦常用词:
- shallow depth of field, background bokeh(浅景深/背景虚化)
- deep depth of field, everything in focus(大景深/全清晰)
- sharp focus on subject(主体清晰对焦)
- rack focus near-to-far / far-to-near(拉焦:近到远/远到近)
5.7 运镜速查(Camera movement)
- 固定机位:locked-off shot / fixed camera
- 慢推:slow dolly in / slow push-in
- 慢拉:slow dolly out / pull-out
- 水平摇:camera pans left/right
- 上下摇:tilt up/down
- 横移:truck left/right
- 升降:crane up/down
- 环绕:orbit around the subject / arc shot
- 跟拍:tracking shot following the subject
- 手持纪实:handheld(更抖更真实)
- 稳定跟拍:steadicam(更稳更电影)
- 快速甩镜:whip pan(动感强,容易翻车,慎用)
- 慢动作/延时:slow motion / time-lapse
5.8 让视频更稳的“负面/约束”提示词
- no flicker(不闪烁)
- no jitter(不抖动)
- no warping / no distortion(不扭曲)
- no morphing(不变形/不乱长)
- consistent face / stable face(脸稳定)
- consistent character / same outfit(角色/服装一致)
- clean background(背景干净,减少杂乱变化)
5.9 运镜范例
- 人像电影慢推:
一位短发少女站在窗边,室内暖光与窗外冷光对比,轻轻抬手拨开刘海,medium close-up,eye-level,85mm,shallow depth of field,slow dolly in,rack focus from foreground to her eyes,cinematic,smooth camera movement,no flicker

- 风景航拍推进:
日出时分的山谷与云海,薄雾流动,阳光穿透云层形成光束,extreme wide shot,bird’s-eye view,24mm,slow drone push forward,cinematic,high detail,smooth,no jitter

- 产品微距环绕:
黑色背景上的香水瓶,玻璃高光与水珠质感,macro lens,extreme close-up,slow orbit around the bottle,soft studio light,sharp focus,no distortion,no flicker

六、 常见问题(快速排查)
图片
- 画面“糊/脏/细节少”:优先提高出图尺寸;减少互相冲突的风格词;主体与背景不要写太多互斥元素
- 人物脸崩/五官不稳定:减少“夸张”修饰词;加“清晰对焦/面部细节”等;必要时使用平台的修复/增强类 AI 应用
- 风格不统一:同一系列固定模型、固定镜头与色调词;少换风格词;用参考图/多图参考锁定基调
- 想更像参考图:用图生图/参考图;把“变化点”写得更具体(只改颜色/只改服装/只换背景等)
视频
- 视频闪烁/抖动/抽搐:加 `smooth camera movement, locked-off / steadicam, no flicker, no jitter`;减少“whip/fast”类词;避免同时写多个相互冲突的运镜
- 人物“变脸/变形/衣服乱变”:强化 `consistent face / stable face / same outfit`;减少夸张动作;尽量一个镜头只做一个动作
- 运镜失控/镜头乱飞:明确写 `fixed camera` 或只写一种运镜;别同时写 `zoom in + dolly out + orbit` 这类冲突组合
到这里,你已经掌握了「海艺通用提示词」的完整思路:
从静态图片的万能公式,到权重控制,再到让画面真正“动起来”的视频写法,本质只有一句话——把你脑海里的画面,拆解成清晰、可执行的语言。
记住几个核心原则👇
● 描述具体永远比堆词更重要
● 一个画面/镜头,只做一件事最稳
● 想高级感,就多从镜头、景别、光影下手
● 不稳定,先加约束,再减动作











