首頁 > 云計算頻道 > 大模型

微軟推出iPhone能跑的ChatGPT級模型，網(wǎng)友：OpenAI得把GPT-3.5淘汰了

2024年04月23日 16:30:06 夢晨來源：量子位 | 公眾號

　　Llama 3發(fā)布剛幾天，微軟就出手截胡了?

　　剛剛發(fā)布的Phi-3系列小模型技術(shù)報告，引起AI圈熱議。

　　其中僅3.8B參數(shù)的Phi-3-mini在多項基準測試中超過了Llama 3 8B。

　　為了方便開源社區(qū)使用，還特意設(shè)計成了與Llama系列兼容的結(jié)構(gòu)。

　　微軟這次打出“手機就能直接跑的小模型”的旗號，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。

　　這意味著，現(xiàn)在手機上能本地運行的最佳開源模型，已經(jīng)做到ChatGPT水平。

　　在技術(shù)報告中還玩了一把花活，讓phi-3-mini自己解釋為什么構(gòu)建小到手機能跑的模型很令人驚嘆。

　　除了mini杯之外，小杯中杯也一并發(fā)布：

　　Phi-3-small，7B參數(shù)，為支持多語言換用了tiktoken分詞器，并額外增加10%多語種數(shù)據(jù)。

　　Phi-3-medium，14B參數(shù)，在更多數(shù)據(jù)上訓練，多數(shù)測試中已超越GPT-3.5和Mixtral 8x7b MoE。

　　(大杯他們目前不打算做)

　　作者陣容一看也不簡單，一眼掃過去MSRA和MSR雷蒙德團隊都投入了不少人。

　　那么，Phi-3系列到底有什么獨特之處呢?

　　根據(jù)技術(shù)報告中披露，其核心秘訣就在于數(shù)據(jù)。

　　去年團隊就發(fā)現(xiàn)，單純堆砌參數(shù)量并不是提升模型性能的唯一路徑。

　　反而是精心設(shè)計訓練數(shù)據(jù)，尤其是利用大語言模型本身去生成合成數(shù)據(jù)，配合嚴格過濾的高質(zhì)量數(shù)據(jù)，反而能讓中小模型的能力大幅躍升。

　　也就是訓練階段只接觸教科書級別的高質(zhì)量數(shù)據(jù)，Textbooks are all you need。

　　Phi-3也延續(xù)了這一思路，這次他們更是下了血本:

　　投喂了多達3.3萬億token的訓練數(shù)據(jù)(medium中杯是4.8萬億)

　　大幅強化了數(shù)據(jù)的”教育水平”過濾

　　更多樣化的合成數(shù)據(jù)，涵蓋邏輯推理、知識問答等多種技能

　　獨特的指令微調(diào)和RLHF訓練，大幅提升對話和安全性

　　舉個例子，比如某一天足球比賽的結(jié)果可能對于大模型是良好的訓練數(shù)據(jù)，但微軟團隊刪除了這些加強知識的數(shù)據(jù)，留下更多能提高模型推理能力的數(shù)據(jù)。

　　這樣一來，對比Llama-2系列，就可以用更小的參數(shù)獲得更高的MMLU測試分數(shù)了。

　　不過小模型畢竟是小模型，也不可避免存在一些弱點。

　　微軟透露，模型本身參數(shù)中沒能力存儲太多事實和知識，這一點也可以從TriviaQA測試分數(shù)低看出來。

　　緩解辦法就是聯(lián)網(wǎng)接入搜索引擎增強。

　　總之，微軟研究院團隊是鐵了心了要在小模型+數(shù)據(jù)工程這條路上走下去，未來還打算繼續(xù)增強小模型的多語言能力、安全性等指標。

　　對于開源小模型超過ChatGPT這回事，不少網(wǎng)友都認為壓力現(xiàn)在給到OpenAI這邊，需要趕快推出GPT-3.5的繼任者了。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

海報生成中...

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

海藝AI的模型系統(tǒng)在國際市場上廣受好評，目前站內(nèi)累計模型數(shù)超過80萬個，涵蓋寫實、二次元、插畫、設(shè)計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創(chuàng)作風格。

OPPO A6l發(fā)布：售價1799元搭載六年長壽大電池

華為Mate X7今日開售：售價12999元起

新聞

市場占比高達35.8%，阿里云引領(lǐng)中國AI云增長

9月9日，國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業(yè)體驗官計劃發(fā)布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業(yè)活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發(fā)布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關(guān)于我單位網(wǎng)站被仿冒一

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責聲明 ┊ 原創(chuàng)新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

微軟推出iPhone能跑的ChatGPT級模型，網(wǎng)友：OpenAI得把GPT-3.5淘汰了

最新新聞

熱門新聞

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

新聞

市場占比高達35.8%，阿里云引領(lǐng)中國AI云增長

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

微軟推出iPhone能跑的ChatGPT級模型，網(wǎng)友：OpenAI得把GPT-3.5淘汰了

擴展閱讀

最新新聞

熱門新聞