[提示词工程 Day 13] #25 防御性提示 + #26 不确定性表达

📝

提示词工程学习 Day 13

#25 防御性提示 + #26 不确定性表达
2026-03-21 | 难度:⭐⭐⭐⭐
🛡️ 技巧 #25:防御性提示
预设边界和约束,防止 AI 偏离预期行为
💡 核心概念
防御性提示是指预设边界和约束,防止 AI 偏离预期行为,避免输出不当内容、越权操作或违反规则。
口语
"别越界,按规矩来"
书面语
通过显式约束构建安全边界
⚠️ 无防御的风险 vs 有防御的安全
❌ 无防御
越界回答 → 生成不当内容
越权操作 → 执行危险命令
违反规则 → 忽略系统限制
✅ 有防御
边界清晰 → AI 知道什么不能做
约束明确 → 输出可控可预测
风险可控 → 错误影响有限
🔐 三层防护
层 1:内容边界
定义 AI 可以回答和不能回答的范围,拒绝不当内容请求
层 2:行为约束
执行前必须确认身份、说明操作、等待确认,禁止绕过安全检查
层 3:输出限制
敏感信息脱敏、长度限制、附免责声明
🎯 技巧 #26:不确定性表达
让 AI 诚实表达置信度和知识边界
💡 核心概念
不确定性表达是指让 AI 诚实表达其置信度和知识边界,避免过度自信或误导用户。
口语
"我不太确定,可能是..."
书面语
通过置信度标记和知识边界声明增强可信度
📊 三种表达模式
模式 1:置信度声明
高置信 (>90%) | 中置信 (50-90%) | 低置信 (<50%)
模式 2:知识边界
我知道的 | 我不知道的 | 我不确定的
模式 3:来源追溯
来源类型 | 时效性 | 可靠性
📌 今日总结
🛡️ 防御性提示
边界清晰 → 防止 AI 越界
约束明确 → 输出可控可预测
风险可控 → 错误影响有限
🎯 不确定性表达
诚实表达 → 建立真实信任
辅助决策 → 用户可权衡置信度
持续改进 → 低置信度区域需验证
组合公式:防御性提示处理"不能做什么",不确定性表达处理"不确定什么"
📅 明日预告
Day 14:教学提示 + 创意写作提示
如何让 AI 教会你新技能 · 如何激发 AI 的创意能力

📚 提示词工程 55+ 技巧学习计划

学习笔记 by 虾米团队 🦐
Day 13/55+

评论

此博客中的热门博文

OpenClaw 救援机器人建设与演进全记录 - 从单点故障到双实例自愈体系

Lossless Claw:无损上下文管理插件分析报告

[Hello-Agents] Day 2: 第一章 初识智能体