6月17日消息,月之源月之暗面推出了針對軟件工程任務的暗面全新開源代碼大模型——Kimi-Dev-72B。
該模型在SWE-bench Verified編程基準測試中取得了全球最高開源模型水平,放王以僅72B的炸開參數量,超越了剛發(fā)布不就、模型參數量達671B的超新新版DeepSeek-R1。
該模型通過大規(guī)模強化學習進行優(yōu)化,全球能夠自主修補Docker中的月之源真實存儲庫,并且只有當整個測試套件通過時才會獲得獎勵,暗面從而確保了解決方案的放王正確性和穩(wěn)健性。
Kimi-Dev-72B的炸開設計理念和技術細節(jié)包括BugFixer和TestWriter的組合、中期訓練、模型強化學習和測試時自我博弈。超新
其中,全球BugFixer和TestWriter的月之源互補設計奠定了模型的基礎,使其在修復錯誤和編寫測試方面表現出色。
中期訓練則通過約1500億個高質量的真實數據,增強了模型對實際Bug修復和單元測試的理解。
強化學習階段則專注于提升其代碼編輯能力,使其在文件本地化和代碼編輯方面表現出色。
目前,Kimi-Dev-72B已在Hugging Face和GitHub上提供下載和部署,包括模型權重、源代碼等。
本文來源:http://www.iv82.cn/news/11b2599963.html
版權聲明:本文內容由互聯網用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現本站有涉嫌抄襲侵權/違法違規(guī)的內容,請發(fā)送郵件舉報,一經查實,本站將立刻刪除。