小米和MiniMax同時放大招,Agent定價戰正式開打
3 月 18 日和 19 日,兩家中國公司先後發布了各自的 Agent 方向大模型。國內 AI 初創公司 MiniMax 推出 M2.7,小米旗下大模型團隊 MiMo 推出 V2-Pro。兩款模型在 Agent benchmark 上均進入全球第一梯隊,但它們的 API 輸出定價分別是 Claude Opus 4.6 的 1/21 和 1/8。
兩家同一周出牌,但手裡的牌完全不同。它們代表了兩條截然不同的技術路線,賭的是 Agent 時代的兩種未來。
同一場考試,1/17 的學費
先看最直觀的對比。

據 OpenRouter 和各公司官方定價頁數據,以 API 輸出價格(每百萬 tokens)計,MiniMax M2.7 是 1.2 美元,MiMo-V2-Pro 是 3 美元。作為參照,Claude Opus 4.6 的輸出價是 25 美元,GPT-5.2 是 14 美元,Claude Sonnet 4.6 是 15 美元。
價格差距是數量級的,但能力差距不是。在 SWE-bench Verified(當前衡量代碼工程能力最主流的 benchmark)上,MiMo-V2-Pro 拿到 78%,Sonnet 4.6 是 79.6%,差距不到兩個百分點。M2.7 的 SWE-Pro 成績為 56.22%,與 GPT-5.3-Codex 持平。在 VIBE-Pro(端到端項目交付能力)上,M2.7 拿到 55.6%,接近 Opus 4.6 的水平。
這張圖的重點不在於誰高誰低——各家的 benchmark 体系不完全對齊,直接比較要謹慎。重點在於那個「價格-性能剪刀差」:國產 Agent 模型已經擠進了同一個能力帶,但站在完全不同的價格區間裡。
萬億參數 vs 自我進化
價格只是表象。兩家公司拿出了兩套完全不同的底牌。
MiMo-V2-Pro 走的是「大力出奇蹟」路線。據小米官方公告,V2-Pro 擁有超過 1 萬億總參數,啟動參數 42B,支持 100 萬 tokens 的超長上下文。它的核心創新是 Hybrid Attention 混合注意力機制,將滑動窗口注意力(SWA)與全局注意力(GA)的比例調至 7:1——前代 V2-Flash 是 5:1。這套架構讓模型在處理長文檔、多工具並行調用的 Agent 場景時更穩定。在 PinchBench(Agent 工具調用能力評測)上,MiMo-V2-Pro 拿到 84%。
M2.7 走了一條完全不同的路。據 MiniMax 3 月 18 日發布的官方技術博客,M2.7 的參數量未公開,但它展示了一種「自迭代進化」機制:模型自主運行 100 輪以上的優化循環,包括分析失敗軌跡、規劃修改、修改自身代碼架構、跑評估、再循環,最終在內部評估集上實現了 30% 的性能提升。在 MLE Bench Lite(機器學習競賽難度評測)的 22 道高難度題中,M2.7 拿下 9 金 5 銀 1 銅,平均獎牌率 66.6%。

從五個維度看,兩條路線的鋒芒朝向完全不同:MiMo-V2-Pro 在上下文長度和代碼工程維度上明顯佔優,M2.7 則在辦公自動化和自迭代能力上拉開距離。據 MiniMax 同篇技術博客,M2.7 在 GDPval-AA(辦公文檔處理評測)上拿到 ELO 1495,居開源模型首位,在覆蓋 40 多個複雜技能的 MM-Claw 測試中保持了 97% 的技能遵循率。
五個月四版本
兩家公司不只技術路線不同,迭代節奏也完全不一樣。
據公開發布記錄,MiniMax 從 2025 年 10 月發布 M2 到 2026 年 3 月發布 M2.7,五個月內迭代了四個版本,平均每 49 天一個大版本。其中 M2.5 到 M2.7 的間隔只有約 30 天。
小米 MiMo 的節奏不同:2025 年 4 月發布 MiMo-7B(7B 參數的開源推理模型),同年 12 月發布 V2-Flash(309B 總參數),2026 年 3 月發布 V2-Pro(1T 總參數)。每一代之間的參數規模跨越更大,但版本間隔也更長。
MiniMax 選擇了小步快跑,每次迭代幅度不大但頻率極高,M2.7 的自迭代機制本身就是為「持續進化」設計的。小米選擇了蓄力一擊,每個版本都是參數規模和架構的大幅躍遷。

匿名 8 天,登頂 OpenRouter
除了技術路線,小米的發布策略也打破了行業慣例。
据 Reuters 報導,3 月 11 日,一个名為 Hunter Alpha 的匿名模型出現在全球最大 API 聚合平台 OpenRouter 上。沒有品牌背書,沒有發布會,沒有技術部落格。它的 API 定價極低,性能卻出人意料地強。
社區開始猜測它的來歷。據 Republic World 和多家科技媒體報導,最主流的猜測是 DeepSeek V4,因為 MiMo 團隊負責人羅福莉此前曾在 DeepSeek 從事研究工作。調用量迅速攀升,匿名期內總調用量突破 1 萬億 tokens,登頂 OpenRouter 週榜第一。

3 月 19 日凌晨,小米揭榜:Hunter Alpha 就是 MiMo-V2-Pro。據 Reuters 同篇報導,揭榜後小米港股一度漲幅達 5.8%。
這是國產大模型第一次在全球平台上以純盲測的方式證明自己。不靠品牌,不靠宣傳,用 8 天時間讓開發者用腳投票。
猜你喜歡

如何在DeFi收益中平衡風險與回報?

湯姆·李的以太坊投資論點:為何那位曾準確預測上一輪行情的人如今正加倍押注Bitmine
湯姆·李正逐漸成為以太坊最具影響力的支持者之一。從Fundstrat到Bitmine,他的以太坊投資論點融合了質押收益、國庫積累以及長線網絡價值。這就是「Tom Lee 以太坊」為何成為加密貨幣領域最受關注的熱點之一。

納瓦爾親自登台:普通人與風險投資之間的歷史碰撞

a16z Crypto:9張圖表助您了解穩定幣的發展趨勢

駁楊海坡《加密貨幣終局》

吹風機能賺到 34,000 美元嗎?解讀預測市場的自反性悖論

6MV創始人:在2026年,加密投資的「標誌性轉折點」已經到來

Abraxas Capital 鑄造了 28.9 億美元的 USDT:是流動性提升,還是僅僅是更多穩定幣套利?
Abraxas Capital剛剛從 Tether 收到了28.9 億美元的新鑄造 USDT。這究竟是對加密貨幣市場的看漲流動性注入,還是穩定幣套利巨頭的日常操作?我們將分析這些數據及其對比特幣、競爭幣和去中心化金融(DeFi)可能產生的影響。

加密貨幣領域的一位風投表示,人工智慧太瘋狂了,他們非常保守

合約算法鐮刀進化史:永續合約十年,幕還未謝

今日比特幣ETF動態:21億美元資金流入是信號,表明機構對BTC需求強勁
比特幣ETF相關消息顯示,過去8個交易日累計淨流入達21億美元,創下近期最強勁的資金淨流入紀錄之一。最新比特幣ETF消息對BTC價格意味著什麼,以及8萬美元的突破關口是否即將到來。

被PayPal踢出局後,馬斯克計畫重返加密貨幣市場

麥可·塞勒:冬天過去了——他說得對嗎?5 個關鍵數據點(2026 年)
麥可·塞勒昨天在推特上發文: “冬天結束了。”這很空頭。這很大膽。這件事在加密貨幣領域引起了熱議。
但他說得對嗎?還是說這只是又一位 CEO 在自我吹噓?
讓我們來看看數據。讓我們保持中立。我們來看看冰是不是真的融化了。

WEEX Bubbles App 正式上線:一眼洞察加密市場走勢 -4.6
WEEX Bubbles 是一款獨立應用,透過直觀的氣泡可視化方式,幫助使用者快速理解複雜的加密市場行情。

Polygon聯合創始人Sandeep:在鏈橋鏈爆炸後寫道

網頁端圖表大升級:支持10+種專業K線樣式,WEEX助您多維洞察市場
為了給各位交易者提供更專業、更全面的市場分析工具,WEEX網頁端圖表已迎來重磅升級,全面支持高達14種專業K線/圖表樣式!

早報 | Aethir 承接 Axe Compute 2.6 億美元企業級合同;新火科技收購 Avenir Group 交易團隊;Polymarket 交易量被 Kalshi 反超

鮑威爾:我們有一個短暫的窗口期來應對通脹
美聯儲主席提名人鮑威爾強調不相信前瞻指引,但希望透過資產負債表和利率政策協同合作來降低通脹。 鮑威爾明確表示不會受任何政治壓力影響,堅持獨立制定貨幣政策。 近期市場動態顯示,有新的地址從幣安提取35,000 ETH並轉移至BitGo。 一名巨鯨增加40,000枚HYPE持幣量,價值約為163萬美元。 Kelp DAO攻擊者將50,700 ETH轉移至兩個新地址中。 WEEX Crypto News, 鮑威爾對抗通脹的策略 鮑威爾表示,美聯儲在現階段必須迅速行動來降低通脹。他拒絕遵循傳統的前瞻指引,而是強調資產負債表和利率政策的協同效果,以應對未來潛在的通脹率。這種方法強調實際操作的靈活性和政策獨立性,[Place Image: Screenshot of Powell’s statement].…
如何在DeFi收益中平衡風險與回報?
湯姆·李的以太坊投資論點:為何那位曾準確預測上一輪行情的人如今正加倍押注Bitmine
湯姆·李正逐漸成為以太坊最具影響力的支持者之一。從Fundstrat到Bitmine,他的以太坊投資論點融合了質押收益、國庫積累以及長線網絡價值。這就是「Tom Lee 以太坊」為何成為加密貨幣領域最受關注的熱點之一。






