MiniMax開源了MiniMax-01全新系列模型性能比肩GPT-4o

2025年01月15日 09:45:47 來源：AIbase基地

　　MiniMax于2025年1月15日宣布開源其全新系列模型MiniMax-01，該系列包含基礎(chǔ)語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01。MiniMax-01系列在架構(gòu)上進(jìn)行了大膽創(chuàng)新，首次大規(guī)模實(shí)現(xiàn)線性注意力機(jī)制，打破了傳統(tǒng)Transformer架構(gòu)的局限。其參數(shù)量高達(dá)4560億，單次激活459億，綜合性能與海外頂尖模型相當(dāng)，且能高效處理長達(dá)400萬token的上下文，這一長度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。

　　MiniMax認(rèn)為2025年將是Agent高速發(fā)展的關(guān)鍵年份，無論是單Agent系統(tǒng)還是多Agent系統(tǒng)，都需要更長的上下文來支持持續(xù)記憶和大量通信。MiniMax-01系列模型的推出，正是為了滿足這一需求，邁出建立復(fù)雜Agent基礎(chǔ)能力的第一步。

微信截圖_20250115091926.png

　　得益于架構(gòu)創(chuàng)新、效率優(yōu)化以及集群訓(xùn)推一體設(shè)計，MiniMax能夠以業(yè)內(nèi)最低的價格區(qū)間提供文本和多模態(tài)理解的API服務(wù)，標(biāo)準(zhǔn)定價為輸入token1元/百萬token，輸出token8元/百萬token。MiniMax開放平臺及海外版已上線，供開發(fā)者體驗(yàn)使用。

　　MiniMax-01系列模型已在GitHub開源，并將持續(xù)更新。在業(yè)界主流的文本和多模態(tài)理解測評中，MiniMax-01系列在多數(shù)任務(wù)上追平了海外公認(rèn)的先進(jìn)模型GPT-4o-1120和Claude-3.5-Sonnet-1022。特別是在長文任務(wù)上，與Google的Gemini模型相比，MiniMax-Text-01隨著輸入長度增加，性能衰減最慢，顯著優(yōu)于Gemini。

　　MiniMax的模型在處理長輸入時效率極高，接近線性復(fù)雜度。其結(jié)構(gòu)設(shè)計中，每8層中有7層采用基于Lightning Attention的線性注意力，1層采用傳統(tǒng)SoftMax注意力。這是業(yè)內(nèi)首次將線性注意力機(jī)制擴(kuò)展到商用模型級別，MiniMax在Scaling Law、與MoE結(jié)合、結(jié)構(gòu)設(shè)計、訓(xùn)練優(yōu)化和推理優(yōu)化等方面進(jìn)行了綜合考量，并重構(gòu)了訓(xùn)練和推理系統(tǒng)，包括更高效的MoE All-to-all通訊優(yōu)化、更長序列優(yōu)化以及推理層面線性注意力的高效Kernel實(shí)現(xiàn)。

　　在大部分學(xué)術(shù)集上，MiniMax-01系列取得了比肩海外第一梯隊的結(jié)果。在長上下文測評集上更是顯著領(lǐng)先，如在400萬的Needle-In-A-Haystack檢索任務(wù)上表現(xiàn)優(yōu)異。除了學(xué)術(shù)數(shù)據(jù)集，MiniMax還構(gòu)建了基于真實(shí)數(shù)據(jù)的助手場景測試集，MiniMax-Text-01在該場景中表現(xiàn)突出。在多模態(tài)理解測試集中，MiniMax-VL-01也較為領(lǐng)先。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

海報生成中...

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

海藝AI的模型系統(tǒng)在國際市場上廣受好評，目前站內(nèi)累計模型數(shù)超過80萬個，涵蓋寫實(shí)、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景，基本覆蓋所有主流創(chuàng)作風(fēng)格。

OPPO A6l發(fā)布：售價1799元搭載六年長壽大電池

華為Mate X7今日開售：售價12999元起

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

9月9日，國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗(yàn)，一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計劃發(fā)布會。

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機(jī)，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺，同比增長33%，顯示出品類強(qiáng)勁的市場需求。

專題

禮儀主持_商業(yè)活動模特演藝服務(wù)公司
九章智算云Alaya NeW Cloud 2.0發(fā)布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關(guān)于我單位網(wǎng)站被仿冒一

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

MiniMax開源了MiniMax-01全新系列模型性能比肩GPT-4o

最新新聞

熱門新聞

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計劃，助力中小企

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

專題

MiniMax開源了MiniMax-01全新系列模型 性能比肩GPT-4o

擴(kuò)展閱讀

最新新聞

熱門新聞

MiniMax開源了MiniMax-01全新系列模型性能比肩GPT-4o