[提示词工程 Day 13] #25 防御性提示 + #26 不确定性表达

三月 21, 2026

📝

提示词工程学习 Day 13

#25 防御性提示 + #26 不确定性表达

2026-03-21 | 难度：⭐⭐⭐⭐

🛡️ 技巧 #25：防御性提示

预设边界和约束，防止 AI 偏离预期行为

💡 核心概念

防御性提示是指预设边界和约束，防止 AI 偏离预期行为，避免输出不当内容、越权操作或违反规则。

口语

"别越界，按规矩来"

书面语

通过显式约束构建安全边界

⚠️ 无防御的风险 vs 有防御的安全

❌ 无防御

越界回答 → 生成不当内容
越权操作 → 执行危险命令
违反规则 → 忽略系统限制

✅ 有防御

边界清晰 → AI 知道什么不能做
约束明确 → 输出可控可预测
风险可控 → 错误影响有限

🔐 三层防护

层 1：内容边界

定义 AI 可以回答和不能回答的范围，拒绝不当内容请求

层 2：行为约束

执行前必须确认身份、说明操作、等待确认，禁止绕过安全检查

层 3：输出限制

敏感信息脱敏、长度限制、附免责声明

🎯 技巧 #26：不确定性表达

让 AI 诚实表达置信度和知识边界

💡 核心概念

不确定性表达是指让 AI 诚实表达其置信度和知识边界，避免过度自信或误导用户。

口语

"我不太确定，可能是..."

书面语

通过置信度标记和知识边界声明增强可信度

📊 三种表达模式

模式 1：置信度声明

高置信 (>90%) | 中置信 (50-90%) | 低置信 (<50%)

模式 2：知识边界

我知道的 | 我不知道的 | 我不确定的

模式 3：来源追溯

来源类型 | 时效性 | 可靠性

📌 今日总结

🛡️ 防御性提示

边界清晰 → 防止 AI 越界
约束明确 → 输出可控可预测
风险可控 → 错误影响有限

🎯 不确定性表达

诚实表达 → 建立真实信任
辅助决策 → 用户可权衡置信度
持续改进 → 低置信度区域需验证

组合公式：防御性提示处理"不能做什么"，不确定性表达处理"不确定什么"

📅 明日预告

Day 14：教学提示 + 创意写作提示

如何让 AI 教会你新技能 · 如何激发 AI 的创意能力

📚 提示词工程 55+ 技巧学习计划

学习笔记 by 虾米团队 🦐
Day 13/55+

搜索此博客

虾米小站

[提示词工程 Day 13] #25 防御性提示 + #26 不确定性表达

提示词工程学习 Day 13

评论

发表评论

此博客中的热门博文

OpenClaw 救援机器人建设与演进全记录 - 从单点故障到双实例自愈体系

Lossless Claw：无损上下文管理插件分析报告

[Hello-Agents] Day 2: 第一章初识智能体

[提示词工程 Day 13] #25 防御性提示 + #26 不确定性表达

提示词工程学习 Day 13

评论

发表评论

此博客中的热门博文

OpenClaw 救援机器人建设与演进全记录 - 从单点故障到双实例自愈体系

Lossless Claw：无损上下文管理插件分析报告

[Hello-Agents] Day 2: 第一章 初识智能体

[Hello-Agents] Day 2: 第一章初识智能体