本文來自于微信公眾號 羅超Pro(ID:uochaotmt),作者:羅超。
11月8日,2023年世界互聯網大會烏鎮峰會開幕。世界互聯網大會早已成為國內規格最高的科技盛事,是展現全球數字經濟最新科技成果的舞臺,是觀察數字經濟潮水奔涌方向的瞭望臺,堪稱數字經濟風向標。在生成式人工智能掀起新一輪技術革命的2023年,烏鎮峰會具備承前啟后的獨特意義。
大模型成烏鎮峰會關鍵詞
隨著ChatGPT、文心一言等產品的爆紅,AI大模型在科技行業掀起了滔天巨浪。預訓練大模型、生成式人工智能也成了今年烏鎮峰會的核心議題之一。
在世界互聯網大會人工智能工作組與百度聯合主辦的“人工智能賦能產業發展”分論壇上,世界互聯網大會人工智能工作組發布了由其編寫的研究報告及共識文件,匯總產業界在金融、交通、教育等14個應用場景的相關案例,提出“發展負責任的生成式人工智能十條共識”。
AI大模型在烏鎮峰會上的強勢存在不只是在論壇上有所體現。作為烏鎮峰會的官方核心活動,“世界互聯網領先科技成果發布活動”在7年后全面升級成“世界互聯網大會領先科技獎”。今年的獲獎項目大都與AI有關,來自互聯網企業的兩個獲獎項目均屬于AI范疇:一個是位列“基礎技術組”的“百度知識增強大語言模型關鍵技術”,另一個是屬于“工程研發組”的“騰訊覓影數智醫療影像平臺”,其中百度“知識增強大語言模型關鍵技術”是唯一獲獎的大模型技術。
百度“知識增強大語言模型關鍵技術”領先在何處?據百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在現場介紹,“人工智能正在引領新一輪科技革命和產業變革,大語言模型讓人們看到了通用人工智能的曙光。知識增強大語言模型關鍵技術,突破知識內化和外用技術,具備知識增強、檢索增強和對話增強的獨有技術優勢,并通過模型與框架聯合優化,突破了訓練規模,提高了訓練效率,提升了模型效果。”
今年3月百度發布知識增強大語言模型文心一言,其具備知識增強、檢索增強和對話增強等技術優勢。5月文心一言的基礎模型升級至文心大模型3.5。8月31日文心一言率先全面開放。10月的世界大會上百度發布了文心大模型4.0,在理解、生成、邏輯、記憶四大能力都有顯著提升,綜合能力與GPT-4相比毫不遜色。
2023年,除早已入局大模型的百度外,阿里、華為等科技巨頭以及多家創業公司均跑步入局大模型賽道,“百模大戰”如火如荼。群雄逐鹿下,大模型賽道也出現了一些怪亂象,一些玩家在資本加持下臨時上陣做大模型甚至一股腦“梭哈”,有的實力不濟也做基礎大模型“重復發明輪子”,有的“渾水摸魚”為了市場炒作強推大模型,更有連核心技術都依靠第三方的“皮包型大模型公司”在湊熱鬧。其實在眾聲喧嘩下,大模型真正重要的只有兩件事:
第一件事是基礎大模型的技術提升,說得更直白一點就是要有能擔綱與GPT抗衡的基礎大模型。在科技自主自立的大時代背景下,這一點至關重要;另一件事是大模型的落地,如果不能應用到實際場景中,大模型狂卷參數“軍備競賽”無意義,畢竟技術只有解決實實在在的問題才有價值。
發展大模型應該基礎技術提升與產業場景落地并重,這正是百度的“大模型觀”。
早在2019年百度就已在積累AI預訓練模型技術并上線文心大模型,當年7月文心大模型升級至2.0,2021年12月正式發布全球首個知識增強千億大模型鵬城-百度·文心,參數規模2600億。
在行業因為ChatGPT關注大模型的前一年,百度就在布局大模型且堅持“不卷參數卷落地”,腳踏實地地推動大模型的落地且提出建設性方案。2022年5月,在WAVE SUMMIT2022深度學習開發者峰會上,百度公布飛槳文心大模型最新全景圖,提出支撐大模型產業落地的3個關鍵路徑并在業內首發基于文心大模型的行業大模型,構建了一套適宜產業應用的大模型體系,同時提供了配套的工具平臺、推動開放生態促創新。
重視場景落地與重視基礎技術并不矛盾,百度深知提升基礎大模型技術水平的重要性。2023年百度文心大模型加快升級步伐,除不斷汲取數據與知識提升智能水平外,通過在輸入與輸出環節進行知識點增強,在基礎大模型上引入智能體機制等手段,提高模型的效率與效果。文心大模型成唯一斬獲“世界互聯網大會領先科技獎”的大模型技術也足以表明,百度在基礎大模型技術上的絕對領先性。尤為重點的一點是,更強的文心大模型進步更快,據王海峰10月發布文心大模型4.0時介紹,在9月小流量上線后,過去一個多月其效果又提升近30%。
基礎大模型能力不斷提升進而呈現越來越強勁的智能涌現,這給大模型落地到更多應用場景、催生出更多創新應用、發揮出更大的智能價值創造了前提條件。在百度世界大會上,李彥宏提出“AI原生應用”的理念,引導開發者重新思考人與機器的交互模式并重新設計AI原生應用,突破傳統互聯網應用的價值邊界,加速大模型在工作、學習、生活、商業、娛樂等場景的大規模落地。如同App的應用形態帶來移動互聯網的大繁榮一樣,AI原生應用正在催生一個龐大繁榮的AI生態。
正如烏鎮峰會“人工智能賦能產業發展”分論壇的主題所示,人工智能最終價值是賦能產業發展,加速千行百業的數字化進程,促進人類社會全面邁向智能化新階段。大模型良性競爭的核心應該回到基礎大模型技術進化與大模型技術落地應用這兩個重點上來。
文心加飛槳共赴星河
大模型不是AI浪潮的起點,而是AI浪潮的延續,但不可否認的是,AI浪潮被其推到了全新高度。
大模型并非突然出現的顛覆性技術,其更準確地稱呼是“預訓練大模型”,“預訓練”字面意思很容易理解:預先訓練好,其通過堆疊數據集“貪婪式”地訓練模式,擁有較強的通用性,理論上可泛化到多種應用場景,而小樣本或零樣本的技術實現,則可讓開發者可快速基于其構建AI應用,而不再需要從0到1訓練數據、建立模型。
在大模型技術出現前,AI技術就已出現60余年。10余年來,隨著深度學習技術的高速發展,AI技術如知識圖譜、機器視覺、語音、自動駕駛等早已被廣泛應用。當AI要實現工業化大生產時,AI要支撐更加廣泛普適的場景,要支撐更大更復雜的AI計算需求,要實現智能水平的不斷升級,依靠傳統訓練模式已無法滿足,大模型生逢其時。
作為深度學習的全新突破,大模型讓AI技術的通用性大幅提升,成為AI從作坊式應用邁向工業化生產的關鍵。不過,大模型不是平地起高樓,它站在深度學習巨人的肩上,兩者一起驅動著智能經濟的爆發。
在烏鎮峰會“人工智能賦能產業發展”分論壇上,王海峰在題為《文心加飛槳 翩然赴星河》的主題演講中,詮釋了深度學習框架與大模型的關系:“深度學習作為人工智能的核心技術,具有很強的通用性,并具備標準化、自動化和模塊化的工業大生產特征,而大模型的興起,使得人工智能應用的深度和廣度進一步拓展。人工智能已進入工業大生產階段。”
深度學習與大模型是協同促進的關系。百度認為,生成式AI和大模型的智能涌現,帶來了全新的計算范式,這使得整個IT的技術棧從原來的三層,變成包括芯片、框架、模型、應用在內的四層結構。
在智能時代的四層IT架構中,芯片層,百度有昆侖等面向AI計算的芯片技術布局;框架層,有飛槳深度學習這樣的平臺;在模型層,則有文心大模型家族(包括文心大模型4.0在內的自然語言處理方向的基礎大模型,視覺、跨模態、生物計算等其他方面的大模型,以及眾多的行業大模型)來克服機器訓練的難題;在應用層,則涌現出智能搜索、智能交通等原生AI應用,互相協同的四層技術棧構成AI時代的通用計算架構。
大模型依賴于軟硬件的協同,向下離不開框架層與芯片層的支持,向上則要通過AI原生應用落地到千行百業。深度學習框架飛槳就作為底座支持了文心大模型的訓練、推理與部署。在萬卡算力上運行的飛槳平臺,通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化,支持了大模型的穩定高效訓練。正是通過飛槳與文心的協同優化,文心大模型周均訓練有效率超過98%,訓練算法效率提升到3月發布時的3.6倍,推理性能提升50倍,由此可見,文心大模型4.0的強勁表現,離不開飛槳深度學習平臺的底層加持。
在大模型加強AI通用性的同時,深度學習在不斷精進,變得越來越標準化、自動化和模塊化,更強大的深度學習平臺驅動著更強大的大模型,加速AI在千行百業落地。因此長期來看,“文心+飛槳”這樣的CP式AI組合,才是更適合AI工業化大生產的解決方案。
10年之約,百度準備好了
烏鎮峰會第十年。10年來的世界互聯網大會上,百度出鏡率高,且與其相關的主題有且只有一個:AI。
除今年奪得“世界互聯網大會領先科技獎”的文心大模型4.0以及2019年入選“世界互聯網大會領先成果”的飛槳深度學習平臺外,百度還有多個項目入選前些年的世界互聯網大會領先成果:百度大腦、DuerOS(小度助手)對話式人工智能操作系統、Apollo,每一個都屬于AI技術。
烏鎮峰會走過的十年,正值數字經濟騰飛的十年。十年間世事變遷,斗轉星移。參與烏鎮峰會的數字經濟企業從2014年的12家增加到2023年的過千家,互聯網行業格局早已是滄海桑田,層出不窮的新技術徹底改變了人們的生活乃至世界的面貌,數字經濟重心已從“在線經濟”全面轉移到“智能經濟”。作為烏鎮峰會十年來的重要參與者與親歷者,置身數字經濟中心的百度已從互聯網企業蛻變成AI公司,成為中國AI產業的扛旗者。
十年,彈指一揮間,百度AI泛舟已十年,AI信仰不曾改變。
不論是布局深度學習還是加碼大模型,百度都不做“追風逐浪”的玩家,它將AI當信仰,對AI的價值十分篤定,對AI的發展路線從無絲毫動搖,一直在力所能及地推動AI朝著正確的方向發展,做“造浪者”而不是“逐浪者”。
百度AI起步于2010年,經過多年的技術積累和市場應用,已經取得了令人矚目的成果。2013年百度深度學習實驗室成立,與谷歌開始布局AI的時間一致。百度做AI最初就有很高的起點,2014年就已大舉在全球范圍尋覓頂尖人才。
技術的投機主義者會審時度勢,根據環境的變化調整投資策略。百度則是AI技術的信仰型玩家,在AI產業陷入低潮的2020年前后,李彥宏對AI技術的篤定也未曾動搖,他對AI此志不渝,也將樂觀的情緒傳遞給行業。在2020年世界人工智能大會上,李彥宏在演講中表示,“當前,人們對人工智能的態度產生迷茫甚至悲觀,這是顛覆性技術在加速普及前的必經階段。迷霧終將散去,智能經濟和智能社會終將成為現實,而人類終將掌握自己的命運。”他當時動情地表示:“我對AI的信仰,沒有絲毫改變。”
十年,百度AI技術不斷開花結果,終于登頂“珠峰”。
百度AI技術體系在深度學習基礎上延展出自然語言處理、圖像識別、語音識別、知識圖譜等領先的人工智能技術,并積淀形成飛槳深度學習平臺、文心大模型。親自主導和參與這一系列技術體系的王海峰已成百度首席技術官,并繼續帶領百度科學家與工程師們在深度學習平臺、大模型等自主AI技術上深耕。百度財報顯示從2012年到2022年的十年間其在AI上已投資超過千億,自上而下構建出覆蓋芯片、云計算平臺、飛槳深度學習平臺、大模型以及上層垂直AI技術應用在內的全棧AI架構。
堅定投資AI是百度攀登技術珠峰的過程,道阻且難且長,十年終于登頂,與全球頂尖AI巨頭們相見于頂峰再論劍。
十年,百度做AI都堅持“基礎技術提升與產業場景落地”并重。
在持續投入深度學習平臺飛槳、基礎大模型文心等AI基礎技術的同時,百度積極地推動AI技術落地。
一方面,百度將AI技術應用到每一個業務的“毛細血管”。除持續用AI重塑搜索、地圖、文庫、網盤等國民級應用外,還成功開創了小度、Apollo等全新業務線。
另一方面,百度積極構建開放的AI生態,與社會力量與資源一起推動AI落地。從飛槳深度學習平臺到文心大模型,核心技術成熟一個開放一個。截至目前飛槳和文心生態已凝聚800萬開發者,服務22萬家企事業單位基于飛槳創建了80萬個模型。除技術開放外,百度積極推動AI產學研協同和人才培養,在2020年提出5年為全社會培養500萬AI人才,現已培養420萬AI人才。在百度世界大會上,百度發布人才培養星河計劃,計劃再培養500萬大模型人才。
在AI工業化大生產階段,百度的開放只會更加徹底。在烏鎮峰會上,面對大模型產業化的挑戰,王海峰表示,類似芯片代工廠模式,可采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數據綜合優勢的企業將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務,這正是百度在大模型技術開放上努力的方向。
十年,AI從實驗室進入到工業化大生產階段,百度準備好了一切。
在繁榮的AI技術生態基礎上,AI應用早已在全面落地。烏鎮景區十年的劇變就是AI一日千里的“縮影”。記得在2016年世界互聯網大會前夕,百度就在烏鎮景區推出了全球首個無人駕駛體驗站,筆者也有幸成為全球第26名體驗百度無人車的乘客。
除無人車這樣的黑科技服務外,烏鎮景區已實現刷臉進園、掃臉入住、智能布草、智能床墊、語音導覽、智慧停車等智慧景區服務,居民的生活與游客的體驗因為AI而徹底改變。
如果我們將目光從烏鎮放大到中國乃至世界來看,AI應用更是層出不窮地出現在人們的身邊,給生活、學習、工作帶來諸多好處,給人類創造更多的福祉。
在烏鎮峰會期間,光明網記者孔繁鑫在《十年之約,烏鎮準備好了》一文中對烏鎮峰會十年進行了生動的復盤。正如他在文中所說,“十年斗轉星移,互聯網的江湖波云詭譎,話題從網絡安全、金融監管切換到數據治理、人工智能,烏鎮卻總能穩穩站在時代風口浪尖,把脈前沿業態、引領發展潮流。”烏鎮大會的十年與百度AI的十年的時間線幾乎吻合,這十年百度一直在深耕AI并與時俱進。
在今天的烏鎮峰會上,AI接棒互聯網成為下一個十年的數字經濟之基石。隨著大模型技術的涌現,AI產業“輕舟已過萬重山”。在全新的AI階段,百度早已做好了準備,文心加飛槳,翩然赴星河。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。