跳转至

大模型应用层

应用层关心“模型怎么被用于真实任务、真实系统、真实业务”。

判断标准:如果一个概念通常不改模型权重,而是改变模型的使用方式、外部知识、工具连接、执行流程或业务交互,就放在这里。

子目录 关注点
01_Prompt与结构化输出 Prompt、Few-shot、CoT、JSON Schema、guided decoding
02_RAG与知识增强 chunk、embedding、向量库、混合检索、rerank、上下文构造
03_ToolCalling与MCP Tool Calling、Function Calling、MCP、工具权限与沙箱
04_Agent工程 Planning、ReAct、Reflection、handoff、多 Agent、workflow 编排
05_记忆与状态 短期上下文、长期记忆、会话状态、任务状态
06_可观测与评测 tracing、guardrails、human-in-the-loop、Agent 成功率评测
07_场景落地 客服、代码助手、搜索问答、数据分析、推荐解释、办公自动化

RAG 属于应用层里的“能力增强算法”:它增强的是整个应用系统的回答能力,而不是直接增强模型参数本身。