Kimi最強開源思考模型 Kimi K2 Thinking發布:推理等超越GPT
11月7日消息,最強日前,開源月之暗面宣布發布Kimi K2 Thinking,思考這是模型Kimi 迄今能力最強的開源思考模型。
目前,布推該模型已上線kimi.com和最新版Kimi手機應用的最強常規對話模式。
據了解,開源Kimi K2 Thinking原生掌握“邊思考,思考邊使用工具”的模型能力,在人類最后的布推考試(Humanity's Last Exam)、自主網絡瀏覽能力(BrowseComp)、最強復雜信息收集推理(SEAL-0)等多項基準測試中表現達到SOTA水平,開源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。
據介紹,該模型無需人類干預,即可自主實現高達300輪的工具調用和持續穩定的多輪思考能力,從而幫助用戶解決更復雜的問題。
人類最后的考試是一項涵蓋100多個專業領域的終極封閉式學術測試。
在允許使用工具——搜索、Python、網絡瀏覽工具的同等情況下,Kimi K2 Thinking在這項基準評測中取得了44.9%的SOTA成績。
根據官方示例顯示,Kimi K2 Thinking經過5輪搜索和推理,結合每輪搜索到的新信息,層層深入,最終推理出了答案:
此外,在復雜搜索和瀏覽場景中,Kimi K2 Thinking模型也表現出色。
BrowseComp是由OpenAI發布的一個專門評估AI Agent網絡瀏覽能力的基準測試,這項測試的初衷是衡量AI Agent在信息過載環境中展現出的堅持性與創造力,即能否像人類研究員一樣“刨根問底”。
在這項極具挑戰的任務上,人類平均只能達到29.2%的成績。
Kimi K2 Thinking在這項基準測試中展現出極強的鉆研能力,以60.2%的成績成為新的SOTA模型。
在長程規劃和自主搜索能力的驅動下,Kimi K2 Thinking可借助多達上百輪的“思考→搜索→瀏覽網頁→思考→編程”動態循環,持續地提出并完善假設、驗證證據、進行推理,并構建出邏輯一致的答案。
這種邊主動搜索邊持續思考的能力,使Kimi K2 Thinking能夠將模糊且開放式的問題分解為清晰、可執行的子任務。
在官方示例中,Kimi K2 Thinking經過兩輪搜索和思考,先根據股票回購的已知信息找到了這家制造快速的公司,然后在美國證券交易委員會(SEC)的官網上找到了股票回購公告信息,得出了準確的答案:
(責任編輯:時尚)
-
2025年12月14日,PITAKA于品牌十周年之際,攜手英國當代藝術家Gordon Hunt,在深圳華僑城OCAT正式啟幕十周年藝術聯展——「覺知伏流 GLINTS OF A
...[詳細]
-
11月28日,杰蘭路咨詢發布了2025年11月新能源汽車產品性價比指數榜單,覆蓋從5萬元至50萬元以上多個主流價格區間。在各細分市場的激烈競爭中,享界S9系列表現尤為搶眼,S9T、S9分別在30萬-4
...[詳細]
-
華為Mate 80系列背殼微縮“MATE”字母:靈感來自晶圓制造 光刻級工藝
11月29日消息,華為今年在Mate 80系列取消了Pro+機型,并且首次推出了Pro Max機型。相比于以往的Pro+,Mate 80 Pro Max的定位和配置有全方位加強,包括性能、配置、工藝等
...[詳細]
-
NVIDIA、AMD、谷歌AI卡實測對比:N卡仍有5倍性價比優勢
11月28日消息,在AI大模型訓練/推理上,NVIDIA的顯卡無疑是目前使用最多的,AMD、Intel及谷歌等公司份額沒法比,問題來了,NVIDIA到底強在哪里?這里不用提什么CUDA生態優勢,也不用
...[詳細]
-
華碩推出Dual RTX 5060 Ti EVO:供電接口位置少見
12月15日消息,華碩近日悄然發布了旗下RTX 5060 Ti顯卡的又一個新版本Dual GeForce RTX 5060 Ti EVO 16G。此前華碩已經推出了Dual GeForce RTX 5
...[詳細]
-
Steam黑五特惠!耕升GeForce RTX 5070 Ti 追風 OC 2.0暢爽游戲佳節
11月已進入尾聲,一年一度的黑色星期五特惠狂歡正式開啟!Steam平臺數千款游戲同時特價銷售!各大游戲大廠商紛紛放出超多史低、新史低精品大作!耕升借此佳節,也為大家挑選了一些非常值得體驗的熱門史低游戲
...[詳細]
-
中國一汽入股零跑或年內簽約 朱江明:實控權 創始團隊必須要堅守
繼Stellantis集團之后,零跑汽車將迎來另一位重磅股東。11月28日,財聯社記者從知情人士處獲悉,目前中國一汽入股零跑汽車的相關工作已進入收尾階段,雙方最快將在今年年內完成簽約。“根
...[詳細]
-
11月29日消息,昨日下午,美團發布了截至9月30日的2025年第三季度財報:營收為955億元,同比增長2.0%。凈虧損186億元。財報發布后,美團董事長兼CEO王興、高級副總裁兼CFO陳少暉參加了隨
...[詳細]
-
無安全員、無乘員 馬斯克發文:特斯拉啟動無人駕駛Robotaxi路測
12月15日消息,馬斯克昨日證實,公司已在得克薩斯州奧斯汀啟動無人駕駛Robotaxi路測,測試車輛內未配備任何乘員。其中兩輛特斯拉Model Y Robotaxi被目擊在奧斯汀公共道路上行駛,車內空
...[詳細]
-
11月28日消息,前不久,紅魔帶來了紅魔11 Pro新機,售價4999元起。現在這款新品已經來到我們評測室,下面為大家帶來圖賞。紅魔11 Pro全球首發悟空屏2.0,6.85英寸,屏占比95.3%,首
...[詳細]

抖音電商上線“職業打假人”新規 借打假違規盈利將重罰
迷你吹雪主板將至 華碩X870、B850吹雪主板雙12幫你解饞
2025河北省縣(區)域兒童籃球聯賽收官
香港火災已造成94人遇難
對標AMD RX550!龍芯中科宣布首款GPU芯片9A1000交付流片
