在近日舉辦的 2023 年數(shù)字科技生態(tài)大會人工智能與數(shù)據(jù)產(chǎn)業(yè)發(fā)展合作論壇論壇上,我們見到了中國電信星辰系列大模型的最新升級,以及針對上述問題所提出的一系列技術(shù)創(chuàng)新。
其中,星辰語義大模型正式發(fā)布了千億參數(shù)版本,在推理和回答準(zhǔn)確性方面都有顯著提升,并將上下文窗口提到了 96K Token。特別是,中國電信首次提出了緩解多輪幻覺的解決方案,使得大模型的幻覺率降低了 40%。
與此同時,中國電信還宣布將加入到開源開放的行列中,預(yù)計今年年底開源百億級別的大模型,明年 4 月則會開源千億級別的大模型,旨在讓更多研究者和開發(fā)者從中受益。此外,中國電信還將根據(jù)星辰大模型構(gòu)建各種工具鏈,以滿足不同用戶的需求。
「幻覺率」降低 40%,星辰語義大模型是如何做到的?
大模型的幻覺問題,是學(xué)界和業(yè)界都非常關(guān)心的問題,也是其落地應(yīng)用面臨的最難挑戰(zhàn)之一。
在千億參數(shù)大模型發(fā)布之前,星辰語義大模型已經(jīng)具備了多版本穩(wěn)定可用的大模型基座,覆蓋 3B、7B、12B 和 130B 等參數(shù)量級。
在目前的大模型領(lǐng)域,百億參數(shù)是一種非常主流的選擇,這也是各家公司基于推理成本等因素的選擇。至于為什么選擇升級打造千億參數(shù)版本的星辰語義大模型,何忠江也解釋了背后的思考。
我們都知道,大模型的底層架構(gòu)是「預(yù)測下一個 token」,導(dǎo)致其容易產(chǎn)生「幻覺」,給出事實上不正確的陳述。何忠江認(rèn)為,從另外一個角度看,這恰恰反映了大模型像人一樣,是因為并沒有真正理解問題,才會回答出風(fēng)馬牛不相及的內(nèi)容。解決辦法可以是加強(qiáng)數(shù)據(jù)溯源,也可以是增加參數(shù)量,這些都能讓大模型學(xué)到更多的東西,并真正地理解一個事物,而不是「胡說八道」。
讓人最為關(guān)注的是,中國電信千億參數(shù)星辰語義大模型在業(yè)界首次提出了緩解多輪幻覺的解決方案,將模型幻覺率降低了 40%。這一方案包括四項關(guān)鍵技術(shù):
關(guān)鍵信息注意力增強(qiáng)技術(shù):通過對關(guān)鍵信息進(jìn)行注意力增強(qiáng),可以提升模型理解能力和答案回復(fù)一致性的能力,較大程度緩解模型幻覺問題;
知識圖譜強(qiáng)化:通過知識圖譜確保訓(xùn)練數(shù)據(jù)集知識事實性,并通過知識圖譜知識提示能力輔助模型知識問答能力提升,大幅降低模型幻覺,提高通用問答準(zhǔn)確率。
多輪知識記憶和強(qiáng)化技術(shù):通過采用更優(yōu)模型知識記憶方案,以及關(guān)聯(lián)信息的強(qiáng)化訓(xùn)練方案,增強(qiáng)了模型上下文記憶能力和關(guān)聯(lián)知識理解能力,增強(qiáng)了上下文回復(fù)一致性,降低了模型幻覺問題;
知識溯源能力:通過多種湖源方式,關(guān)聯(lián)問題相關(guān)參考出處,生成答案更加可靠。

另一方面,中國電信將此前的百億參數(shù)增加到千億級別,使得星辰語義大模型獲得了很大的性能提升:
首先,星辰語義大模型在長文本生成和長文理解上提升尤其明顯,分別有 30% 和 20% 的提升;其次,在知識問答方面提升 18%,在對內(nèi)開放平臺上回答正確率更可達(dá) 98%,可支持 96K Token 上下文理解;此外,邏輯推理、數(shù)學(xué)能力和代碼能力等方面,也有 10-15% 不等的提升。
截止目前,電信大模型已在電信內(nèi)外多個場景落地:對內(nèi)可提升辦公、生產(chǎn)協(xié)同效率,包括了行文寫作、代碼編程、網(wǎng)絡(luò)故障分析以及經(jīng)營分析等多場景;對外可賦能 2B 和 2G 業(yè)務(wù)場景,提質(zhì)提效、優(yōu)化體驗。同時,中國電信也聯(lián)合多樣化的工具輔助,來提高大模型在不同領(lǐng)域下的使用體驗,包括外掛知識、插件使用以及百余種預(yù)置 Prompts。
從對話框走向千行百業(yè),大模型落地還需要什么?
人們都在期待著規(guī)模化的 AI 應(yīng)用誕生,而這種成果必將來自于大模型的底層創(chuàng)新。
除了讓大語言模型的本行 —— 文本的理解與生成能力不斷進(jìn)化之外,科技巨頭也競相推出多模態(tài)方面的更新,將更多 AI 驅(qū)動的工具直接集成到核心產(chǎn)品中。比如這幾個月來,OpenAI 陸續(xù)賦予了 ChatGPT 看(GPT-4V)、聽(Whisper)、說(最新 TTS 技術(shù))、畫(DALL・E)的能力。
前幾天,OpenAI 召開了自家的首場開發(fā)者大會。全新升級后的 GPT-4 Turbo API ,將這些多模態(tài)能力開放給了每一位用戶。當(dāng)多模態(tài)能力被整合,必然會催生很多場景化應(yīng)用。
何忠江指出,實際場景中的大模型應(yīng)用不僅是一個簡單的對話框,需要與多模態(tài)模型聯(lián)動,才能真正去改變一些工作的流程和思路,提高其效率。而我們此前所熟悉的大模型 —— 語義大模型會是整個通用人工智能的核心,起到類似人類大腦的思考作用。
因此,在星辰語義大模型的打造過程中,中國電信同時開發(fā)了星辰多模態(tài)大模型和星辰語音大模型。
在這場論壇中,中國電信隆重介紹了星辰多模態(tài)大模型,該模型主要聚焦提升圖文生成、圖文理解能力,訓(xùn)練了超過 12 億各種風(fēng)格數(shù)據(jù),支持近 20 種繪畫風(fēng)格,中文意象理解生成能力提升 30%,語義細(xì)粒度生成效果提升 25%。

此外,星辰語音大模型也是一大亮點。據(jù)介紹,星辰語音大模型基于數(shù)十萬小時語音數(shù)據(jù)進(jìn)行訓(xùn)練,具備精準(zhǔn)的多語種 / 方言語音識別、語音實時自定義敏感詞檢測、超自然多音色語音生成和編輯、聲音匿名等多項語音能力,支持智能會議、智慧辦公、智能客服、智能語音機(jī)器人等多場景解決方案。

以「智能客服」為例,何忠江介紹說,此前 TTS 技術(shù)已經(jīng)能夠合成非常優(yōu)美的聲音,但還遠(yuǎn)遠(yuǎn)算不上自然,接電話的人很容易識別出聲音是否由機(jī)器生成,這就是 TTS 技術(shù)在落地智能客服應(yīng)用受到的最大阻礙。據(jù)統(tǒng)計,這類合成人聲的掛斷率甚至達(dá)到 70% 左右。
要想破解應(yīng)用的問題,就要依靠技術(shù)創(chuàng)新,達(dá)到「高仿真」。星辰語音大模型目前已經(jīng)實現(xiàn)「超自然人聲合成」,比如下面這段聲音,聽起來和真人發(fā)音別無二致,語氣詞和停頓節(jié)奏都比較還原:
在通用模型之外,面向垂直領(lǐng)域的行業(yè)大模型也是各個廠商的「必爭之地」。構(gòu)建一個智能對話框不是最難的,讓大模型融入具體的業(yè)務(wù)、成為新的生產(chǎn)工具更重要。對此,中國電信已早早布局。
本次論壇中,中國電信宣布了首批試商用 12 個行業(yè)大模型,包括星辰教育大模型、治理大模型、政務(wù)服務(wù)大模型、應(yīng)急大模型、醫(yī)保大模型、交通大模型、住建大模型、金融大模型、神農(nóng)一號大模型、出行大模型、旅游導(dǎo)覽大模型、礦山大模型。
比如星辰教育大模型,這是中國電信基于教育行業(yè)億級服務(wù)數(shù)據(jù)沉淀,訓(xùn)練出具有國家中英文作文特級教師水平的「精準(zhǔn)教學(xué)大模型」,15 秒就能完成一篇中英文作文的打分、點評和改進(jìn)建議,目前已在河南 1.2 萬師生教學(xué)中應(yīng)用并取得良好的效果。再比如星辰基層治理大模型,主要應(yīng)用場景包括矛盾調(diào)節(jié)助手、線上法律顧問和公文助手等,目前已在某些城市的多個基層社區(qū)上線應(yīng)用。
通用人工智能,越來越近
轉(zhuǎn)眼間,距離 ChatGPT 發(fā)布已經(jīng)快過去一年,熱度卻絲毫未減。究其原因,是因為大模型終于清晰地指出了一條前往通用人工智能的路。
一直以來,中國電信都將通用人工智能的目標(biāo)當(dāng)成長期努力的方向。近年來,從視覺、語音、語義到集各種模態(tài)能力于一身的數(shù)字人,中國電信目前已完成了全面布局,很多技術(shù)成果也逐漸投入實際生產(chǎn)使用。
談到對通用人工智能的理解,何忠江表示,這仍然是一條漫長的道路,包括「感知智能」、「認(rèn)知智能」、「具身智能」、「群體智能」幾種階段。
理想中的人工智能是像人一樣能看、能聽、會思考。借助視覺和語音的技術(shù),模型把信息采集到以后,核心是要對信息做出判斷,給出下一步的決策思路,這其實就是大語言模型在目前階段起到的作用。
當(dāng)這種決策能力落在虛擬空間中的數(shù)字人或是現(xiàn)實空間中的機(jī)器人,就意味著「具身智能」的誕生,假如數(shù)字人和機(jī)器人能夠相互協(xié)作、統(tǒng)籌和調(diào)度,這就意味著「群體智能」誕生了,通用人工智能在這個過程中離我們越來越近。

比如在下方這個案例中,星辰語義大模型用來撰寫宣傳主題文案,星辰多模態(tài)大模型用來繪制產(chǎn)品海報,在這個過程中,數(shù)字人起到了下達(dá)指令的作用,也可視為人類的「數(shù)字分身」。
最開始,數(shù)字人將任務(wù)描述為:「中國電信有一款最新的產(chǎn)品是直連衛(wèi)星的產(chǎn)品,我們假設(shè)要給這款產(chǎn)品做一些廣告宣傳的文案,我們應(yīng)該通過大模型怎么來做?」短短兩分鐘,一張精美的海報就完成了。
面向下一階段的競爭,中國電信的萬億大模型已經(jīng)開啟訓(xùn)練計劃,并預(yù)計將于明年 5 月份完成。據(jù)了解,電信萬億參數(shù)大模型是以「成長策略」進(jìn)行訓(xùn)練,是首個萬億稠密大模型,將擁有更高階的「智能」。
可以想象的是,在不遠(yuǎn)的未來,融合語言、視覺和語音等多模態(tài)能力的大模型將會適應(yīng)現(xiàn)實世界中不同模態(tài)的任務(wù),逐漸接近甚至超越人類的水平。曾經(jīng)只會出現(xiàn)在科幻作品的情節(jié),終將走進(jìn)現(xiàn)實。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。