字節跳動豆包大模型團隊最近開源了Multi-SWE-bench,這是首個多語言代碼修復基準數據集,旨在提升大模型在自動修Bug能力方面的評估。
相較于以往的SWE-bench,Multi-SWE-bench不僅覆蓋了Python,還新增了Java、TypeScript等六種語言,構建了1632個真實任務,并引入了難度分級機制。
Multi-SWE-bench是首個多語言代碼修復基準數據集,覆蓋7種主流編程語言。
數據集包含1632個真實任務,經過嚴格篩選和人工驗證,確保質量可靠。
實驗顯示大語言模型在Python修復上表現尚可,但在其他語言的修復率低于10%。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。