Appearance
0.4 当前技术版图
AI 领域的新东西太多,很容易陷入"什么都想学、什么都没学透"的状态。这一节帮你建立一张地图,知道哪些东西在哪个位置。
整体版图
┌─────────────────────────────────────────────┐
│ 你能直接使用的层 │
│ Claude / GPT / Gemini / DeepSeek / Qwen │
│ Codex / Cursor / Claude Code │
├─────────────────────────────────────────────┤
│ 工程能力层(重点学习) │
│ Prompt工程 · RAG · Agent · MCP · 评估 │
├─────────────────────────────────────────────┤
│ 基础设施层(理解即可) │
│ 向量数据库 · 模型服务 · API 网关 │
├─────────────────────────────────────────────┤
│ 模型层(了解原理) │
│ Transformer · 训练 · Fine-tuning │
└─────────────────────────────────────────────┘你现在主要在顶层,目标是把中间两层也搞透。底层的模型层,了解原理就够,不需要自己动手。
主要模型提供商
国际厂商:
| 提供商 | 主要模型 | 特点 |
|---|---|---|
| Anthropic | Claude 4 系列(Opus/Sonnet/Haiku) | 长上下文、代码强、安全性高 |
| OpenAI | GPT 系列、o 系列推理模型 | 生态最成熟、工具最多 |
| Gemini 系列 | 多模态强、超长上下文、与 Google 生态集成好 | |
| Meta | Llama 系列 | 开源、可以本地运行 |
| Mistral | Mistral、Codestral | 轻量、开源 |
国产厂商(国内做工程通常优先这些,详见 0.5 国产大模型生态):
| 提供商 | 主要模型 | 特点 |
|---|---|---|
| 深度求索 DeepSeek | DeepSeek-V4 | 性价比极高、代码与推理强、开源 |
| 阿里 通义千问 | Qwen 系列 | 生态最全、模型矩阵最大、有 Embedding |
| 智谱 GLM | GLM 系列 | 推理与 Agent 能力强 |
| 字节 豆包 | Doubao 系列 | 价格激进、火山引擎生态 |
📌 你不需要每个都会用。选 1-2 个主力(根据你的项目),深入理解它的特性和限制就够了。国内项目建议主力 DeepSeek,补位阿里百炼。
工具生态
开发辅助类(你正在用的)
- Claude Code — Anthropic 官方 CLI,支持 Agent 模式
- Codex — OpenAI 的代码 Agent
- Cursor、Windsurf — AI 增强的 IDE
- GitHub Copilot — 嵌入式代码补全
框架类(用来构建 AI 产品)
- LangChain、LlamaIndex — RAG 和 Agent 框架
- Vercel AI SDK — 前端友好的 AI 集成
- Mastra — 新兴的 Agent 框架
基础设施类
- Pinecone、Weaviate、Qdrant — 向量数据库
- OpenRouter — 统一的多模型 API 网关
哪些在快速变化,哪些相对稳定
⚠️ 快速变化的(追热点意义不大)
- 具体的模型版本(GPT-4o → o1 → o3 每几个月就换)
- 新框架(每周都有人发布"更好的 LangChain")
- 各种 benchmark 排名
✅ 相对稳定的(值得深投资)
- Transformer 架构的基本原理(2017年提出至今未变)
- RAG 的核心思路
- Prompt 工程的基本方法论
- Agent 的设计模式
- MCP 协议(刚刚标准化,生态在建立)
📌 关键结论
- AI 版图分四层,你需要从顶层开始,向下逐层理解
- 不需要学所有模型,选 1-2 个深入就够
- 把时间投在"相对稳定"的部分,快速变化的部分跟踪就好,不要深钻
下一节:0.5 国产大模型生态