豆包大模型團隊正式宣布,首個面向多語言開發環境的代碼修復評測基準 Multi-SWE-bench 已開源。
該數據集擴展了 SWE-bench 的能力,首次覆蓋 Python 之外的 7 種主流編程語言(Java、Go、Rust、C、C++、TypeScript、JavaScript),構建了真實的跨語言代碼修復任務。Multi-SWE-bench 包含 1,632 個實例,均來自 GitHub issue,并經過專業開發者審核,具備清晰問題描述與可復現測試環境。
其引入的任務難度分級機制,涵蓋從簡單修改到復雜多文件操作,旨在系統評估大模型的多語言泛化能力,推動自動編程技術向支持多語言、解決真實問題的通用智能體邁進。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。