AI 应用架构模式
概述
当你设计 AI 产品功能时,需要在多种技术架构中做选择。每种架构有不同的成本、复杂度和适用场景。
三大核心决策
在开始 AI 功能设计前,先回答这个问题:
纯 Prompt Engineering → 不够?→ RAG → 还不够?→ 微调
↑ 最简单、最快 ↑ 中等复杂度 ↑ 最复杂、最贵| 方案 | 适用场景 | 成本 | 周期 |
|---|---|---|---|
| Prompt Engineering | 通用能力、格式控制 | 低 | 小时级 |
| RAG | 需要特定知识、实时信息 | 中 | 天级 |
| 微调(Fine-tuning) | 需要特定风格、专业领域 | 高 | 周级 |
RAG(检索增强生成)
RAG 是当前最主流的 AI 应用架构之一,核心思想:先检索相关信息,再让 LLM 基于检索结果生成回答。
架构流程
用户提问 → 查询理解 → 向量检索 → 相关文档 → LLM 生成 → 回答
↑
向量数据库
(预处理好的文档)关键组件
- 文档处理管道:文档分块(Chunking)、清洗、结构化
- 嵌入模型(Embedding):将文本转为向量表示
- 向量数据库:存储和检索向量(Pinecone、Weaviate、Chroma 等)
- 检索排序:相似度搜索 + 重排序(Reranking)
- 生成层:LLM 基于检索结果生成回答
PM 需要关注的决策
- 分块策略:块太大信息冗余,块太小丢失上下文
- 检索精度:检索不准,生成再好也没用
- 知识更新频率:数据多久更新一次?实时还是批量?
- 回答溯源:能否标注信息来源?
AI Agent
Agent 是能自主规划、使用工具、完成复杂任务的 AI 系统。
架构模式
单 Agent 系统
用户指令 → Agent(规划 + 执行) → 工具调用 → 结果多 Agent 协作
用户指令 → 编排器 Agent
├── 研究 Agent → 搜索工具
├── 分析 Agent → 数据工具
└── 写作 Agent → 文档工具
→ 汇总结果 → 回答关键能力
- 规划(Planning):将复杂任务拆解为步骤
- 工具调用(Tool Use):调用 API、搜索、执行代码
- 记忆(Memory):维护对话历史和任务状态
- 反思(Reflection):检查自己的输出并修正
MCP(Model Context Protocol)
Anthropic 提出的标准协议,让 AI 模型能以统一方式连接外部工具和数据源,类似 AI 世界的"USB 接口"。
PM 需要关注的决策
- 自主程度:Agent 能自主决策到什么程度?哪些需要人工确认?
- 可靠性:Agent 执行链越长,出错概率越高
- 成本控制:多步骤 Agent 的 Token 消耗远高于单轮问答
- 可观测性:如何监控 Agent 的执行过程?
混合架构
实际产品中,往往会组合多种模式:
用户输入 → 意图路由
├── 简单问答 → 直接 LLM 回答
├── 知识查询 → RAG 检索 + 生成
├── 复杂任务 → Agent 规划 + 执行
└── 敏感操作 → 人工审核流程架构选择原则
从简单开始,按需增加复杂度。 不要一上来就搭建多 Agent 系统,先用 Prompt Engineering 验证需求,再逐步引入 RAG 和 Agent。