您的當前位置:首頁 > 綜合 > Kimi最強開源思考模型 Kimi K2 Thinking發布:推理等超越GPT 正文
時間:2025-12-18 07:06:10 來源:網絡整理 編輯:綜合
11月7日消息,日前,月之暗面宣布發布Kimi K2Thinking,這是Kimi 迄今能力最強的開源思考模型。目前,該模型已上線kimi.com和最新版Kimi手機應用的常規對話模式。據了解,Kim
11月7日消息,最強日前,開源月之暗面宣布發布Kimi K2 Thinking,思考這是模型Kimi 迄今能力最強的開源思考模型。
目前,布推該模型已上線kimi.com和最新版Kimi手機應用的最強常規對話模式。
據了解,開源Kimi K2 Thinking原生掌握“邊思考,思考邊使用工具”的模型能力,在人類最后的布推考試(Humanity's Last Exam)、自主網絡瀏覽能力(BrowseComp)、最強復雜信息收集推理(SEAL-0)等多項基準測試中表現達到SOTA水平,開源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。
據介紹,該模型無需人類干預,即可自主實現高達300輪的工具調用和持續穩定的多輪思考能力,從而幫助用戶解決更復雜的問題。
人類最后的考試是一項涵蓋100多個專業領域的終極封閉式學術測試。
在允許使用工具——搜索、Python、網絡瀏覽工具的同等情況下,Kimi K2 Thinking在這項基準評測中取得了44.9%的SOTA成績。
根據官方示例顯示,Kimi K2 Thinking經過5輪搜索和推理,結合每輪搜索到的新信息,層層深入,最終推理出了答案:
此外,在復雜搜索和瀏覽場景中,Kimi K2 Thinking模型也表現出色。
BrowseComp是由OpenAI發布的一個專門評估AI Agent網絡瀏覽能力的基準測試,這項測試的初衷是衡量AI Agent在信息過載環境中展現出的堅持性與創造力,即能否像人類研究員一樣“刨根問底”。
在這項極具挑戰的任務上,人類平均只能達到29.2%的成績。
Kimi K2 Thinking在這項基準測試中展現出極強的鉆研能力,以60.2%的成績成為新的SOTA模型。
在長程規劃和自主搜索能力的驅動下,Kimi K2 Thinking可借助多達上百輪的“思考→搜索→瀏覽網頁→思考→編程”動態循環,持續地提出并完善假設、驗證證據、進行推理,并構建出邏輯一致的答案。
這種邊主動搜索邊持續思考的能力,使Kimi K2 Thinking能夠將模糊且開放式的問題分解為清晰、可執行的子任務。
在官方示例中,Kimi K2 Thinking經過兩輪搜索和思考,先根據股票回購的已知信息找到了這家制造快速的公司,然后在美國證券交易委員會(SEC)的官網上找到了股票回購公告信息,得出了準確的答案:
外媒:泰國計劃包機接回滯留柬埔寨的公民2025-12-18 06:45
如果嫌錢多燙手 那就開一家汽車商超店吧2025-12-18 06:38
iPhone 17 Pro Max成功破解運行iPadOS!體驗神似Mac2025-12-18 06:38
趙心童獲利雅得季斯諾克錦標賽冠軍2025-12-18 06:35
全球首款10000mAh手機來了!榮耀WIN系列邁入萬級電池時代2025-12-18 06:14
最強Mate供不應求!華為Mate 80系列官網發貨已排到2026年1月底2025-12-18 05:52
加速還債回國!賈躍亭喜迎第二家上市公司:FX Super One進生產階段2025-12-18 05:42
(經濟觀察)民企出海“各顯身手” 全球市場煥新中國印象2025-12-18 05:31
考研沖刺不孤單 京東3C數碼聯合商超打造“考研搭子”暖心登場2025-12-18 05:23
iPhone Air用戶不買賬 史上最薄iPhone初期銷量遠遜預期2025-12-18 04:46
為家里還債40余萬 腦癱美妝博主被質疑裝病 母親回應2025-12-18 06:57
最強Mate來了!華為Mate 80發布會將在線上舉行:明天見2025-12-18 06:45
馬光遠力挺俞敏洪南極全員信:寫的不錯 不亢不卑 沒有迎合網絡情緒2025-12-18 06:37
美的集團董事長方洪波成仰望U8L鼎世版車主 王傳福親自交車2025-12-18 05:55
我國發現全新礦物!中文名“金秀礦”2025-12-18 05:49
阿里“千問”App首周下載破1000萬 刷新AI類應用增長紀錄2025-12-18 05:43
多股較強冷空氣來襲 保暖穿搭成消費熱點2025-12-18 05:21
Meta發布WorldGen 一句話生成宏大可交互3D場景2025-12-18 05:18
大屏與AI協同 三星Galaxy Z TriFold帶來高效的圖文生成和處理體驗2025-12-18 05:14
小米汽車副總裁“辟謠”:小米汽車致8人死亡系謠言 公關總經理徐潔云現身附和2025-12-18 05:02