一張精心策劃的學習地圖:9 個階段、23 個動手練習、240+ 精選資源。
從 Prompt Engineering 到 Harness Engineering,從零到生產級 Agent。
共享 Stage 0-2 基礎之後,根據你的目標選擇 CLI 能力者之路或 Agent 構建者之路。
不同職業對 AI Agent 的需求不同——這裡為 5 種典型角色設計了對應的學習路徑與重點。
這個項目最重要的知識框架——從寫好提示詞,到管理上下文,到讓 Agent 行為框架本身可編程。
點擊每個階段展開查看練習、資源和學習目標。
💡 提示:點擊任意練習卡片可查看該練習的完整 README。
適合 PM、知識工作者、想快速提效的人。專注於熟練使用 Claude Code、Codex、Gemini CLI 等現有工具,不寫代碼。
路徑:Stage 0-2 共修基礎 → 跳過 Stage 3/4/6/7(編程內容)→ 直接學 Stage 5(Claude Code 生態)+ Stage 7.5(高階概念)+ Stage 8(Agent 接口)。同步學 tracks/cli/ 三個專屬文檔(A1/A2/A3)。
適合開發者、研究者,想從零構建自己的 Agent 系統。覆蓋 Tool Use、框架對比、RAG、多 Agent、生產部署等全棧能力。
路徑:從 Stage 0 一路打到 Stage 8。Stage 3-4 是 Agent 構建轉折點,Stage 6 是記憶/RAG,Stage 7 是生產級 + 可觀測性。配合 walkthroughs/build-first-agent-in-7-steps 端到端實戰。
學什麼:Python 基礎、CLI 操作、Git 版本控制、API 概念、JSON 格式。這是一切的起點——確保你的開發環境就緒。
動手做:安裝 Ollama → 拉取 gemma4:e4b 模型(約 7.5GB)→ 運行第一個本地 LLM 對話。
學什麼:Token 概念、API 調用方式、LLM 供應商對比、本地 vs 雲端 LLM 的取捨。理解 LLM 的本質——一個概率性的文本生成器。
學什麼:System Prompt 設計、Few-shot 示例、Chain-of-Thought 推理鏈、Context Engineering 入門。這是概念三層演進的第一層。
練習形式:內嵌在 stage 文檔的 <details> 折疊塊中,每個練習 8-15 行核心代碼。
學什麼:Function Calling、ReAct 循環、工具選擇策略、Schema 設計。這是從使用者到構建者的轉折點——你將手寫第一個 Agent 循環。
學什麼:LangGraph、CrewAI、Smolagents、Pydantic AI 四大框架對比。理解不同框架的設計哲學——圖狀態機 vs 角色扮演 vs CodeAct vs 類型安全。
學什麼:MCP Server 協議、Skills 系統、Plugins 架構、Subagents 子代理。這是 Claude 生態的全景圖——從工具協議到技能系統到多代理編排。
已有的 meta 示例:tool-calling-tutor — 一個可安裝的 Claude Code Skill,用於診斷 tool-calling 問題。
學什麼:向量數據庫、Embedding 原理、文檔分塊策略、完整 RAG 管道、Agent 長期記憶。讓你的 Agent 擁有「記憶」——能記住對話歷史和外部知識。
學什麼:多 Agent 編排模式、Agent 評估方法、可觀測性/監控、高級 SDK(Streaming + Caching)、FastAPI 部署。這是概念三層演進的頂層——Harness Engineering。
學什麼:12 個高階概念的閱讀地圖:PAR 循環(Plan-Act-Reflex)、Agent-as-Judge、Guardrail 模式、Reflexion 持久記憶迴圈等。沒有代碼,純粹的概念理解。
定位:這是 Stage 7 到 Stage 8 之間的「橋樑」——用一週時間消化高階概念,為最後的 Agent 接口學習做準備。
學什麼:Computer Use(屏幕操控)、Browser Use(網頁瀏覽)、Code Sandbox(代碼沙箱)。讓 Agent 不僅能對話,還能「看見」和「操作」真實世界。
練習形式:練習內嵌在 stage 文檔中,因為涉及特殊環境(瀏覽器、屏幕錄製等)。
每個練習文件夾遵循統一結構。按以下順序操作,最大化學習效果。
選擇你的語言版本(zh-TW / zh-Hans / English),理解練習目標和預期成果。
讀 requirements.txt,執行 pip install -r requirements.txt。注意同時包含 openai 和 anthropic SDK。
⚠️ 關鍵:starter.py 是完整解答,不是 TODO 骨架。先自己嘗試寫,哪怕寫不出來也沒關係。
讀 starter.py(Path A: Ollama),理解差距。運行它,觀察輸出。看末尾的 # === 自我驗證 === 塊。
執行 pytest test.py 驗證理解。測試使用 mock,不需要真實 API 調用。
讀 starter_anthropic.py(Path B: Anthropic),對比本地 vs 雲端的實現差異。pytest test_anthropic.py。
看 README 的 📚 callout,路由到 Datawhale hello-agents、Anthropic Cookbook 等深度教程繼續學習。
當你需要深入某個主題時,查閱 resources/ 下的專項指南。每個主題都有三語版本。
三種預算方案,從完全免費到全雲端。推薦混合方案——本地練習 + 雲端對比。
| 方案 | 說明 | 預算 |
|---|---|---|
| 全本地 Ollama | 所有練習用本地 LLM,零 API 費用 | $0 |
| 混合推薦 ⭐ | 本地練習(Path A)+ 雲端對比(Path B,用 Haiku) | $2–5 |
| 全 Sonnet | 所有練習用 Claude Sonnet,最高質量 | $20–50 |
模型選擇建議:
Stage 1-2 用 gemma4:e4b(本地,$0)
Stage 3+ 用 qwen2.5:3b(本地,$0,可靠的 tool-use 支持)
雲端對比用 claude-haiku-4-5($1/$5 per 1M tokens,最便宜)