Skip to content

AI 应用架构模式

概述

当你设计 AI 产品功能时,需要在多种技术架构中做选择。每种架构有不同的成本、复杂度和适用场景。

三大核心决策

在开始 AI 功能设计前,先回答这个问题:

纯 Prompt Engineering → 不够?→ RAG → 还不够?→ 微调
     ↑ 最简单、最快              ↑ 中等复杂度        ↑ 最复杂、最贵
方案适用场景成本周期
Prompt Engineering通用能力、格式控制小时级
RAG需要特定知识、实时信息天级
微调(Fine-tuning)需要特定风格、专业领域周级

RAG(检索增强生成)

RAG 是当前最主流的 AI 应用架构之一,核心思想:先检索相关信息,再让 LLM 基于检索结果生成回答。

架构流程

用户提问 → 查询理解 → 向量检索 → 相关文档 → LLM 生成 → 回答

                    向量数据库
                    (预处理好的文档)

关键组件

  1. 文档处理管道:文档分块(Chunking)、清洗、结构化
  2. 嵌入模型(Embedding):将文本转为向量表示
  3. 向量数据库:存储和检索向量(Pinecone、Weaviate、Chroma 等)
  4. 检索排序:相似度搜索 + 重排序(Reranking)
  5. 生成层:LLM 基于检索结果生成回答

PM 需要关注的决策

  • 分块策略:块太大信息冗余,块太小丢失上下文
  • 检索精度:检索不准,生成再好也没用
  • 知识更新频率:数据多久更新一次?实时还是批量?
  • 回答溯源:能否标注信息来源?

AI Agent

Agent 是能自主规划、使用工具、完成复杂任务的 AI 系统。

架构模式

单 Agent 系统

用户指令 → Agent(规划 + 执行) → 工具调用 → 结果

多 Agent 协作

用户指令 → 编排器 Agent
              ├── 研究 Agent → 搜索工具
              ├── 分析 Agent → 数据工具
              └── 写作 Agent → 文档工具
           → 汇总结果 → 回答

关键能力

  • 规划(Planning):将复杂任务拆解为步骤
  • 工具调用(Tool Use):调用 API、搜索、执行代码
  • 记忆(Memory):维护对话历史和任务状态
  • 反思(Reflection):检查自己的输出并修正

MCP(Model Context Protocol)

Anthropic 提出的标准协议,让 AI 模型能以统一方式连接外部工具和数据源,类似 AI 世界的"USB 接口"。

PM 需要关注的决策

  • 自主程度:Agent 能自主决策到什么程度?哪些需要人工确认?
  • 可靠性:Agent 执行链越长,出错概率越高
  • 成本控制:多步骤 Agent 的 Token 消耗远高于单轮问答
  • 可观测性:如何监控 Agent 的执行过程?

混合架构

实际产品中,往往会组合多种模式:

用户输入 → 意图路由
            ├── 简单问答 → 直接 LLM 回答
            ├── 知识查询 → RAG 检索 + 生成
            ├── 复杂任务 → Agent 规划 + 执行
            └── 敏感操作 → 人工审核流程

架构选择原则

从简单开始,按需增加复杂度。 不要一上来就搭建多 Agent 系统,先用 Prompt Engineering 验证需求,再逐步引入 RAG 和 Agent。

用 AI 思维做产品