国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

京東MALL現(xiàn)場直擊多款多噴頭3D打印機實操評測 消費級3D打印機迎來新突破里程碑時刻!縱橫第100家體驗中心榮耀啟幕,筑牢中國豪華越野品類生態(tài)根基惡意利用“七無天無理由退貨”政策法律不予支持!央視曝光“摸摸黨”拼多多聯(lián)席董事長趙佳臻:Temu將All In中國供應鏈以科技守味非遺!卡薩帝冰箱冬至將全國啟幕「好好吃」餃子館字節(jié)TRAE,正悄悄“解放”600萬工程師酷開再獲國家級“信任牌照”:數(shù)據(jù)安全彰顯戰(zhàn)略定力ThinkPad 2025黑FUN禮——了不起的offer,企業(yè)采購專享狂歡來襲!拼多多宣布實行聯(lián)席董事長制度 下一個三年爭取再造一個拼多多菜鳥將入股九識智能 無人車業(yè)務有望大整合抖音上線“長輩防走失模式”同程旅行發(fā)布2025年度旅行榜:長線出行北上廣至川藏航線熱度居首XR專利首案在歐洲落地,中國智造出海風險與機遇并行超能小度,賦能生長,小度全屋智能舉辦年終核心服務商成長特訓營破“內(nèi)卷”、立標準、向未來 光伏行業(yè)領(lǐng)袖共話行業(yè)生態(tài)重塑之道AI重構(gòu)2026年線上帶貨新生態(tài):零庫存爆單、小紅書月銷百萬,開啟AI小店副業(yè)新時代人形機器人租賃市場大幅降溫 行業(yè)商業(yè)化路徑仍待探索阿里云AI Landing Zone正式發(fā)布,助力企業(yè)從“上好云”到“用好AI”的戰(zhàn)略升級118家標桿企業(yè)脫穎而出,定義AI時代的雇主標桿!2025NFuture最佳雇主AI榜單重磅發(fā)布昇思人工智能框架峰會 | MindSpore Lite混合精度推理,實現(xiàn)內(nèi)存節(jié)省30%,助力鴻蒙翻譯模型輕量化部署
  • 首頁 > 云計算頻道 > 大模型

    微軟推出iPhone能跑的ChatGPT級模型,網(wǎng)友:OpenAI得把GPT-3.5淘汰了

    2024年04月23日 16:30:06 來源:量子位 | 公眾號

      Llama 3發(fā)布剛幾天,微軟就出手截胡了?

      剛剛發(fā)布的Phi-3系列小模型技術(shù)報告,引起AI圈熱議。

      其中僅3.8B參數(shù)的Phi-3-mini在多項基準測試中超過了Llama 3 8B

      為了方便開源社區(qū)使用,還特意設(shè)計成了與Llama系列兼容的結(jié)構(gòu)。

      微軟這次打出“手機就能直接跑的小模型”的旗號,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。

      這意味著,現(xiàn)在手機上能本地運行的最佳開源模型,已經(jīng)做到ChatGPT水平。

      在技術(shù)報告中還玩了一把花活,讓phi-3-mini自己解釋為什么構(gòu)建小到手機能跑的模型很令人驚嘆。

      除了mini杯之外,小杯中杯也一并發(fā)布:

      Phi-3-small,7B參數(shù),為支持多語言換用了tiktoken分詞器,并額外增加10%多語種數(shù)據(jù)。

      Phi-3-medium,14B參數(shù),在更多數(shù)據(jù)上訓練,多數(shù)測試中已超越GPT-3.5和Mixtral 8x7b MoE。

      (大杯他們目前不打算做)

      作者陣容一看也不簡單,一眼掃過去MSRA和MSR雷蒙德團隊都投入了不少人。

      那么,Phi-3系列到底有什么獨特之處呢?

      根據(jù)技術(shù)報告中披露,其核心秘訣就在于數(shù)據(jù)

      去年團隊就發(fā)現(xiàn),單純堆砌參數(shù)量并不是提升模型性能的唯一路徑。

      反而是精心設(shè)計訓練數(shù)據(jù),尤其是利用大語言模型本身去生成合成數(shù)據(jù),配合嚴格過濾的高質(zhì)量數(shù)據(jù),反而能讓中小模型的能力大幅躍升。

      也就是訓練階段只接觸教科書級別的高質(zhì)量數(shù)據(jù),Textbooks are all you need

      Phi-3也延續(xù)了這一思路,這次他們更是下了血本:

      投喂了多達3.3萬億token的訓練數(shù)據(jù)(medium中杯是4.8萬億)

      大幅強化了數(shù)據(jù)的”教育水平”過濾

      更多樣化的合成數(shù)據(jù),涵蓋邏輯推理、知識問答等多種技能

      獨特的指令微調(diào)和RLHF訓練,大幅提升對話和安全性

      舉個例子,比如某一天足球比賽的結(jié)果可能對于大模型是良好的訓練數(shù)據(jù),但微軟團隊刪除了這些加強知識的數(shù)據(jù),留下更多能提高模型推理能力的數(shù)據(jù)

      這樣一來,對比Llama-2系列,就可以用更小的參數(shù)獲得更高的MMLU測試分數(shù)了。

      不過小模型畢竟是小模型,也不可避免存在一些弱點。

      微軟透露,模型本身參數(shù)中沒能力存儲太多事實和知識,這一點也可以從TriviaQA測試分數(shù)低看出來。

      緩解辦法就是聯(lián)網(wǎng)接入搜索引擎增強。

      總之,微軟研究院團隊是鐵了心了要在小模型+數(shù)據(jù)工程這條路上走下去,未來還打算繼續(xù)增強小模型的多語言能力、安全性等指標。

      對于開源小模型超過ChatGPT這回事,不少網(wǎng)友都認為壓力現(xiàn)在給到OpenAI這邊,需要趕快推出GPT-3.5的繼任者了。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。

    新聞

    市場占比高達35.8%,阿里云引領(lǐng)中國AI云增長

    9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |