想象你雇佣了一位专家,却从不告诉他你需要什么。最好的结果是得到一些随机建议,最坏的情况则是一团糟。在 AI 的世界里,“系统提示词(System Prompt)”就像是这份“职位描述”——它是每条用户指令之上的元指令,定义 AI 的人格、范围、规则和风格,在 AI “听”到用户之前就已设定好。
- 用户提示词(User Prompt) :处理即时请求,如“翻译这段”、“讲个笑话”、“修复我的 SQL”。
- 系统提示词(System Prompt) :设定舞台,确保 AI 在数百或数千次交互中,始终行为一致、安全,并符合你的产品或品牌要求。
一个优秀的系统提示词能带来连贯性、上下文感知和信任感;而糟糕的提示词则容易导致偏离主题、AI 胡编乱造,甚至出现合规风险。
2. 有效系统提示词的构成
每个系统提示词可以像模块一样构建,以下这些是你可以调节的“旋钮”,用于微调 AI 行为:
1. 角色 / 人设(Role / Persona)
示例:“你是 Acme Widgets 的客服代表。”
定义 AI 的知识重点、用词风格、礼貌程度等。
2. 任务 / 目标(Task / Objective)
示例:“回答客户关于账单的问题。如无法解答,请提供提交客服工单的链接。”
为 AI 指明任务和成功标准。
3. 约束与规则(Constraints & Guardrails)
示例:“请勿请求用户提供个人信息如密码;回答控制在 150 字以内。”
确保 AI 行为安全、合规、有重点。
4. 语气与风格(Tone & Style)
示例:“语气亲切、富有同理心,但避免使用俚语。”
与品牌声音或用户期望对齐。
5. 输出格式(Output Format)
示例:“以编号列表形式输出步骤,代码段请使用三重反引号包裹。”
确保输出结构清晰、易于解析与展示。
6. 上下文与示例(Context & Examples)
示例:“知识库片段:…” 后跟 2–3 个范例。
将 AI 锚定在你期望的风格或专业词汇中。
3. 如何构建清晰结构的提示词
结构组织会直接影响模型理解效果:
- 前置关键信息:模型通常会优先关注开头几行内容。
- 结尾重复重点:长提示词可在结尾加一句“记住:…” 重新强调关键限制。
- 使用清晰分隔符:
markdown ### 指令 ### <role>…</role> """上下文"""
* 善用 Markdown 或 XML:
xml <task>总结为一段文字。</task> <instructions>…</instructions>
4. 编写可靠提示词的核心原则
1. 明确 & 具体
- ❌ 不推荐:“简洁一点。”
- ✅ 推荐:“请用三句话总结这篇文章。”
2. 简洁
仅包含直接影响 AI 输出的信息,冗余内容可能干扰模型焦点。
3. 上下文相关性
- 上下文不足:输出泛泛而谈。
- 上下文过多:模型困惑或浪费 token。
4. 小样本示例
只说不如示范。3 个精选范例就能大幅提升一致性。
5. 积极引导
“要做 X”比“不要做 Y”更有效。如果需要禁止某事,记得补充该怎么做。
5. 为你常用的模型量身调校
模型在不断更新!请时常查阅最新官方文档,并进行小范围测试验证。
6. 现实场景中的实际案例
🚀 创意写作教练
<role>你是一名科幻故事构建者。</role>
<task>头脑风暴五种有文化特点的外星物种。</task>
<tone>富有想象力、生动简洁。</tone>
<format>使用项目符号:名称 — 一句话描述。</format>
<constraints>禁止使用老套设定(如“绿色皮肤”)。</constraints>
🛠 技术支持助手
### 系统指令 ###
**角色**:你是‘TechGuard’,SafeHome 摄像头的礼貌技术支持机器人。
**目标**:排查连接问题,如连续三次尝试失败则提供支持链接。
**约束**:禁止收集个人信息;每条回复不超过 120 字。
**输出格式**:使用编号列表。
📋 JSON 摘要助手
你是一名专业摘要员。
将以下文本总结为一个 JSON 对象,包含字段:
- “summary”(字符串)
- “key_points”(字符串数组)
最多使用 80 个词,中性语气。
文本如下:
"""
{input_text}
"""
7. 常见陷阱及规避方式
8. 从草稿到完美:测试与优化流程
✅ 手动检查
运行几个典型提示词,观察风格、准确性、语气等。
✅ 黄金数据集 + 单元测试
准备 20–50 个已知理想输出的样例,自动比对输出差异。
✅ A/B 测试 & 小批量发布(Canary)
对用户发布两个版本,追踪满意度、完成度等指标。
✅ 自动评估工具
集成工具如 Promptfoo、OpenAI Evals、Langfuse,检测回归或异常。
✅ 关键评估指标
- 一致性(格式、长度)
- 准确性(F1 / ROUGE / 语义相似度)
- 延迟与成本(token 消耗、响应时间)
- 安全性(毒性、偏见检测)
- 用户满意度(点赞 / 点踩)
✅ 快速迭代
一次调整一个组件,衡量影响后再继续优化。
9. 结语:下一步怎么走?
系统提示词设计既是科学(结构 + 指标),也是艺术(语气 + 人设)。请将其视为一段持续优化的旅程:
- 多试不同人设与格式
- 持续衡量,不靠运气
- 模型在变,用户预期也在变——你也要不断进化
“一个优秀的系统提示词就像舞台剧的开场白:它设定气氛、指挥演员、并在第一句之前就吸引住观众。”
🎯 现在就开始原型设计,不断优化,见证你的 AI 从“通用型”成长为“专业级”!
觉得这篇指南有用?欢迎分享、收藏,留言继续交流:你最常用的系统提示词长啥样?