AI 应用架构模式

概述

当你设计 AI 产品功能时，需要在多种技术架构中做选择。每种架构有不同的成本、复杂度和适用场景。

三大核心决策

在开始 AI 功能设计前，先回答这个问题：

纯 Prompt Engineering → 不够？→ RAG → 还不够？→ 微调
     ↑ 最简单、最快              ↑ 中等复杂度        ↑ 最复杂、最贵

方案	适用场景	成本	周期
Prompt Engineering	通用能力、格式控制	低	小时级
RAG	需要特定知识、实时信息	中	天级
微调（Fine-tuning）	需要特定风格、专业领域	高	周级

RAG（检索增强生成）

RAG 是当前最主流的 AI 应用架构之一，核心思想：先检索相关信息，再让 LLM 基于检索结果生成回答。

架构流程

用户提问 → 查询理解 → 向量检索 → 相关文档 → LLM 生成 → 回答
                         ↑
                    向量数据库
                    (预处理好的文档)

关键组件

文档处理管道：文档分块（Chunking）、清洗、结构化
嵌入模型（Embedding）：将文本转为向量表示
向量数据库：存储和检索向量（Pinecone、Weaviate、Chroma 等）
检索排序：相似度搜索 + 重排序（Reranking）
生成层：LLM 基于检索结果生成回答

PM 需要关注的决策

分块策略：块太大信息冗余，块太小丢失上下文
检索精度：检索不准，生成再好也没用
知识更新频率：数据多久更新一次？实时还是批量？
回答溯源：能否标注信息来源？

AI Agent

Agent 是能自主规划、使用工具、完成复杂任务的 AI 系统。

架构模式

单 Agent 系统

用户指令 → Agent（规划 + 执行） → 工具调用 → 结果

多 Agent 协作

用户指令 → 编排器 Agent
              ├── 研究 Agent → 搜索工具
              ├── 分析 Agent → 数据工具
              └── 写作 Agent → 文档工具
           → 汇总结果 → 回答

关键能力

规划（Planning）：将复杂任务拆解为步骤
工具调用（Tool Use）：调用 API、搜索、执行代码
记忆（Memory）：维护对话历史和任务状态
反思（Reflection）：检查自己的输出并修正

MCP（Model Context Protocol）

Anthropic 提出的标准协议，让 AI 模型能以统一方式连接外部工具和数据源，类似 AI 世界的"USB 接口"。

PM 需要关注的决策

自主程度：Agent 能自主决策到什么程度？哪些需要人工确认？
可靠性：Agent 执行链越长，出错概率越高
成本控制：多步骤 Agent 的 Token 消耗远高于单轮问答
可观测性：如何监控 Agent 的执行过程？

混合架构

实际产品中，往往会组合多种模式：

用户输入 → 意图路由
            ├── 简单问答 → 直接 LLM 回答
            ├── 知识查询 → RAG 检索 + 生成
            ├── 复杂任务 → Agent 规划 + 执行
            └── 敏感操作 → 人工审核流程

架构选择原则

从简单开始，按需增加复杂度。 不要一上来就搭建多 Agent 系统，先用 Prompt Engineering 验证需求，再逐步引入 RAG 和 Agent。

AI 应用架构模式 ​

概述 ​

三大核心决策 ​

RAG（检索增强生成） ​

架构流程 ​

关键组件 ​

PM 需要关注的决策 ​

AI Agent ​

架构模式 ​

单 Agent 系统 ​

多 Agent 协作 ​

关键能力 ​

MCP（Model Context Protocol） ​

PM 需要关注的决策 ​

混合架构 ​

AI 应用架构模式

概述

三大核心决策

RAG（检索增强生成）

架构流程

关键组件

PM 需要关注的决策

AI Agent

架构模式

单 Agent 系统

多 Agent 协作

关键能力

MCP（Model Context Protocol）

PM 需要关注的决策

混合架构