本文來自于微信公眾號 AIGC開放社區(qū)(ID:AIGCOPEN),作者:AIGC開放社區(qū)。
10月17日,微軟在官網(wǎng)宣布,現(xiàn)在可以在AzureOpenAI公共預覽版中對GPT-3.5-Turbo、Babbage-002和Davinci-002模型進行數(shù)據(jù)微調(diào)。
使得開發(fā)人員通過自己的數(shù)據(jù)集,便能打造獨一無二的ChatGPT。例如,通過海量醫(yī)療數(shù)據(jù)進行微調(diào),構(gòu)建專注醫(yī)療領域的ChatGPT助手,可詢問與醫(yī)療相關(guān)的病歷、專業(yè)術(shù)語、治療方案等內(nèi)容。
目前,全球各行業(yè)積累了幾年甚至幾十年的巨量優(yōu)質(zhì)數(shù)據(jù),如何高效利用、查詢這些數(shù)據(jù)成為一大難題。
通過自有數(shù)據(jù)微調(diào)打造的AI助手可有效解決這一痛點,同時提升內(nèi)容的準確性、安全性,是組織實現(xiàn)降本增效的利器。
什么是數(shù)據(jù)微調(diào)
大模型數(shù)據(jù)微調(diào)(Fine-tuning)是一種遷移學習方法,用于深度學習和機器學習。通常數(shù)據(jù)微調(diào)是基于一個預訓練好的模型(例如,GPT-3.5-Turbo)作為基石,然后在特定的任務數(shù)據(jù)集(例如,法律、醫(yī)療、營銷)上進行額外的訓練,使模型能生成特定業(yè)務領域的內(nèi)容。
例如,你想訓練一個模型來回答法律相關(guān)的問題,首先在大量的通用文本數(shù)據(jù)上進行預訓練,然后在醫(yī)學問答數(shù)據(jù)集上進行微調(diào)。
簡單來說,微調(diào)功能就是讓ChatGPT,完全按照你的數(shù)據(jù)來生成內(nèi)容。
需要注意的是,即便你有高質(zhì)量的數(shù)據(jù)集,但選擇的微調(diào)模型性能很差,生成的內(nèi)容也不會很理想。
而微軟提供基于OpenAI的GPT-3.5-Turbo,是一個經(jīng)過全球數(shù)百萬開發(fā)者驗證的高性能成熟模型。
Azure OpenAI新功能
Babbage-002和Davinci-002是微軟最新推出的GPT-3基礎模型,可生成文本、代碼等,沒有接受過遵循指令的訓練。但在微調(diào)、托管服務費用方面更便宜。
Babbage-002取代了已棄用的Ada和Babbage 模型, Davinci-002則取代了Curie和 Davinci。
GPT-3.5-Turbo是OpenAI性能最成熟模型之一,支持多輪深度對話、創(chuàng)建微調(diào)數(shù)據(jù)集、訓練和部署等一站式開發(fā)服務。
Azure OpenAI微調(diào)功能演示
上傳數(shù)據(jù):微軟在Azure OpenAI內(nèi)置了數(shù)據(jù)過濾功能,當檢測到用戶上傳的數(shù)據(jù)集包含非法、歧視等有害信息時,會自動刪除這些內(nèi)容。以下是上傳數(shù)據(jù)集代碼示例。
預訓練:使用指定模型、訓練和驗證數(shù)據(jù),并設置相應的參數(shù)。開發(fā)者可將Azure OpenAI Studio用于簡單的GUI,或者使用微軟的REST API或OpenAI Python SDK。
開始啟動微調(diào)功能。
完成微調(diào)后,將返回評估指標,例如,訓練和驗證損失等參數(shù)。
目前,微軟提供數(shù)據(jù)微調(diào)托管服務,用戶無需擔心任何算力資源問題,只需要選擇時間即可。
收費標準:Babbage-002為34美元/小時;Davinci-002為68美元/小時;GPT-3.5-Turbo為102美元/小時。
3)Azure OpenAI 服務中的推理托管:當用戶完成微調(diào)后,就可以使用模型生成專屬內(nèi)容了。
如果你沒有足夠的算力資源平臺來支撐模型的日常輸出,微軟同樣提供了托管服務。
收費標準:Babbage-002托管每小時1.7美元,Davinci-002每小時1.7美元,GPT-35-Turbo,每小時7美元。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。