前言:AI 程式碼助手戰爭進入新階段

在 2026 年的今天,AI 驅動的程式碼助手已經成為開發者日常工作中不可或缺的工具。從 Anthropic 的 Claude Code 到 OpenAI 的 Codex CLI,各大科技巨頭紛紛投入這場技術競賽。然而,一場來自中國的「安靜伏擊」正在悄然進行。

小米於 2026 年 6 月 10 日正式宣布推出 MiMo Code V0.1.0,這是一款基於終端機的開源 AI 程式碼助手,宣稱在關鍵的代理式程式碼基準測試中,特別是在超長程、多步驟任務(200 步驟以上)中超越 Anthropic 的 Claude Code。

這不僅僅是一個新工具的發布,更代表了 AI 程式碼助手領域的一個重要轉折點:從單純依賴模型能力,轉向重視代理框架工程的架構設計


核心分析:MiMo Code 的技術創新與差異化策略

解決「AI 健忘症」:跨工作階段記憶體系統

任何經常使用 AI 程式碼助手的開發者都有一個共同的痛點:隨著工作時間拉長,AI 代理的表現逐漸下降。當上下文視窗被填滿時,早期的決策、規範和任務狀態會被壓縮甚至完全遺失,迫使開發者不斷重複解釋專案背景。

小米的 MiMo 團隊在發布部落格中直言:「我們需要的不是更好的壓縮技術,而是一個明確的儲存與檢索機制,決定什麼資訊應該寫入持久化結構,以及何時應該被召回。」

MiMo Code 透過一個四層次的跨工作階段記憶體系統來解決這個問題:

記憶體層次 描述
專案記憶體 持久的 MEMORY.md 檔案
工作階段檢查點 記錄當前狀態的快照
草稿筆記 臨時工作筆記
任務進度日誌 每個任務的進展記錄

這個系統的關鍵創新在於獨立的「檢查點寫入器」子代理(checkpoint-writer subagent)。想像一個大型建築專案:主要程式碼代理就像是施工承包商,專注於建造實體結構;而檢查點寫入器子代理則像是一位專屬建築師,即時更新藍圖,記錄決策、問題和實際地形。

當上下文視窗接近極限時,系統可以從結構化的檢查點重建環境,確保操作的連貫性不會中斷。

自我改進機制

MiMo Code 還內建了兩個自我改進機制:

  1. /dream 命令:大約每七天審查歷史工作階段,進行去重並壓縮到長期記憶體中
  2. distill 功能:從過去的工作階段中挖掘重複的工作流程以實現自動化,這與 OpenAI 和 Anthropic 最近採用的方法類似

基準測試表現

根據小米技術部落格公布的數據,MiMo Code 搭配 MiMo-V2.5-Pro 在三项測試中均超越 Claude Code 搭配 Claude Sonnet 4.6:

基準測試 MiMo Code Claude Code
SWE-bench Verified 82% 79%
SWE-bench Pro 62% 55%
Terminal Bench 2 73% 69%

更具體地說,代理框架本身的貢獻約為 5 個百分點的提升。使用相同的 MiMo-V2.5-Pro 模型在兩個框架中運行,MiMo Code 在 SWE-bench Pro 上獲得 62%,而 Claude Code 為 57%。

人類雙盲評估的啟示

更有趣的數據來自小米內部測試:在 576 位開發者參與的雙盲 A/B 測試中,在 200 步驟以下,兩個系統各佔 50%;但超過 200 步驟後,MiMo Code 的勝率超過 65%。這支持了小米的核心論點:其記憶體和狀態管理架構特別在長程工作中發揮優勢。


市場策略:極具侵略性的定價與開源策略

模型規格與定價

MiMo Code 隨附「MiMo Auto」,提供限時免費訪問 MiMo-V2.5 的管道。該模型具有以下特點:

  • 架構:稀疏專家混合(MoE)設計
  • 參數量:總共 3100 億參數(每次推理僅激活 150 億)
  • 上下文視窗:100 萬 token

Pro 版本的 MiMo-V2.5-Pro 則擁有 1.02 萬億參數(激活 420 億),採用混合注意力架構。

定價策略極具競爭力:

模型 輸入(每百萬 token) 輸出(每百萬 token)
MiMo-V2.5 $0.40 $2.00
MiMo-V2.5 Pro(≤256K) $1.00 $3.00

這使得 MiMo 成為全球最便宜的邊界級模型之一。

「安靜伏擊」策略

小米的 MiMo AI 部門由 DeepSeek R1 項目的資深人士羅福利率領,他將小米的邊界級推動描述為「安靜伏擊」。該策略與 DeepSeek、Alibaba 的 Qwen、MiniMax 和 Moonshot AI 的 Kimi 系列相似:以美國實驗室價格的一小部分,發布真正具備能力的模型和工具,並透過開源授權轉換開發者關注度為持久的生態系統


專業點評與未來展望

技術層面的客觀評估

MiMo Code 的發布代表了 AI 程式碼助手領域的一個重要認知轉變:代理框架工程的重要性正在與原始模型能力並駕齊驅。這與業界越來越意識到「如何組織和使用模型」比「模型本身」更重要的趨勢一致。

跨工作階段記憶體系統的設計尤其值得稱道。它解決了當前 AI 代理的一個根本性限制,並透過明確的儲存和檢索機制來實現這一點,而不是依賴簡單的壓縮技術。

產業影響

  1. 開源生態系統的崛起:小米的策略進一步推動了 AI 工具的開源化,這可能削弱美國科技巨頭的市場主導地位。

  2. 定價壓力:極具競爭力的定價將迫使其他供應商重新評估其價格策略。

  3. 架構創新的重要性:MiMo Code 的成功表明,專注於代理設計和記憶體管理可能比單純追求更大的模型更有效。

潛在挑戰與限制

然而,讀者也應該注意以下幾點:

  • 自我報告的數據:基準測試數據尚未經過獨立驗證
  • 時限免費模式:免費訪問是「限時」的,意味著未來可能有成本
  • 資料隱私考量:程式碼上下文會經過小米的伺服器,這對於有嚴格資料駐留政策的企業可能是問題
  • V0.1.0 的成熟度:版本號表明這仍然是一個早期產品
  • 地緣政治因素:美國政府對中國技術供應商的採購限制可能影響企業採用

未來展望

MiMo Code 的發布標誌著 AI 程式碼助手戰爭正式全球化。隨著中國科技公司的積極參與,我們可以期待:

  • 更多開源代理框架的出現
  • 更激進的定價策略
  • 更專注於解決實際開發者痛點的技術創新
  • 跨國技術生態系統的進一步融合與競爭

對於開發者而言,這意味著更多的選擇和更低的進入門檻。對於企業而言,這是一個需要仔細評估的技術選項——特別是對於那些尋求降低成本和增加靈活性同時保持對供應商鎖定的控制力的組織。


延伸思考與常見問題