幻覺率直降40%，中國電信千億參數(shù)「星辰大模型」炸場，業(yè)界首提緩解多輪幻覺解決方案

2023年11月15日 10:13:49 來源：機(jī)器之心公眾號

　　在近日舉辦的 2023 年數(shù)字科技生態(tài)大會人工智能與數(shù)據(jù)產(chǎn)業(yè)發(fā)展合作論壇論壇上，我們見到了中國電信星辰系列大模型的最新升級，以及針對上述問題所提出的一系列技術(shù)創(chuàng)新。

　　其中，星辰語義大模型正式發(fā)布了千億參數(shù)版本，在推理和回答準(zhǔn)確性方面都有顯著提升，并將上下文窗口提到了 96K Token。特別是，中國電信首次提出了緩解多輪幻覺的解決方案，使得大模型的幻覺率降低了 40%。

　　與此同時，中國電信還宣布將加入到開源開放的行列中，預(yù)計今年年底開源百億級別的大模型，明年 4 月則會開源千億級別的大模型，旨在讓更多研究者和開發(fā)者從中受益。此外，中國電信還將根據(jù)星辰大模型構(gòu)建各種工具鏈，以滿足不同用戶的需求。

　　「幻覺率」降低 40%，星辰語義大模型是如何做到的?

　　大模型的幻覺問題，是學(xué)界和業(yè)界都非常關(guān)心的問題，也是其落地應(yīng)用面臨的最難挑戰(zhàn)之一。

　　在千億參數(shù)大模型發(fā)布之前，星辰語義大模型已經(jīng)具備了多版本穩(wěn)定可用的大模型基座，覆蓋 3B、7B、12B 和 130B 等參數(shù)量級。

　　在目前的大模型領(lǐng)域，百億參數(shù)是一種非常主流的選擇，這也是各家公司基于推理成本等因素的選擇。至于為什么選擇升級打造千億參數(shù)版本的星辰語義大模型，何忠江也解釋了背后的思考。

　　我們都知道，大模型的底層架構(gòu)是「預(yù)測下一個 token」，導(dǎo)致其容易產(chǎn)生「幻覺」，給出事實上不正確的陳述。何忠江認(rèn)為，從另外一個角度看，這恰恰反映了大模型像人一樣，是因為并沒有真正理解問題，才會回答出風(fēng)馬牛不相及的內(nèi)容。解決辦法可以是加強(qiáng)數(shù)據(jù)溯源，也可以是增加參數(shù)量，這些都能讓大模型學(xué)到更多的東西，并真正地理解一個事物，而不是「胡說八道」。

　　讓人最為關(guān)注的是，中國電信千億參數(shù)星辰語義大模型在業(yè)界首次提出了緩解多輪幻覺的解決方案，將模型幻覺率降低了 40%。這一方案包括四項關(guān)鍵技術(shù)：

　　關(guān)鍵信息注意力增強(qiáng)技術(shù)：通過對關(guān)鍵信息進(jìn)行注意力增強(qiáng)，可以提升模型理解能力和答案回復(fù)一致性的能力，較大程度緩解模型幻覺問題;

　　知識圖譜強(qiáng)化：通過知識圖譜確保訓(xùn)練數(shù)據(jù)集知識事實性，并通過知識圖譜知識提示能力輔助模型知識問答能力提升，大幅降低模型幻覺，提高通用問答準(zhǔn)確率。

　　多輪知識記憶和強(qiáng)化技術(shù)：通過采用更優(yōu)模型知識記憶方案，以及關(guān)聯(lián)信息的強(qiáng)化訓(xùn)練方案，增強(qiáng)了模型上下文記憶能力和關(guān)聯(lián)知識理解能力，增強(qiáng)了上下文回復(fù)一致性，降低了模型幻覺問題;

　　知識溯源能力：通過多種湖源方式，關(guān)聯(lián)問題相關(guān)參考出處，生成答案更加可靠。

　　另一方面，中國電信將此前的百億參數(shù)增加到千億級別，使得星辰語義大模型獲得了很大的性能提升：

　　首先，星辰語義大模型在長文本生成和長文理解上提升尤其明顯，分別有 30% 和 20% 的提升;其次，在知識問答方面提升 18%，在對內(nèi)開放平臺上回答正確率更可達(dá) 98%，可支持 96K Token 上下文理解;此外，邏輯推理、數(shù)學(xué)能力和代碼能力等方面，也有 10-15% 不等的提升。

　　截止目前，電信大模型已在電信內(nèi)外多個場景落地：對內(nèi)可提升辦公、生產(chǎn)協(xié)同效率，包括了行文寫作、代碼編程、網(wǎng)絡(luò)故障分析以及經(jīng)營分析等多場景;對外可賦能 2B 和 2G 業(yè)務(wù)場景，提質(zhì)提效、優(yōu)化體驗。同時，中國電信也聯(lián)合多樣化的工具輔助，來提高大模型在不同領(lǐng)域下的使用體驗，包括外掛知識、插件使用以及百余種預(yù)置 Prompts。

　　從對話框走向千行百業(yè)，大模型落地還需要什么?

　　人們都在期待著規(guī)模化的 AI 應(yīng)用誕生，而這種成果必將來自于大模型的底層創(chuàng)新。

　　除了讓大語言模型的本行 —— 文本的理解與生成能力不斷進(jìn)化之外，科技巨頭也競相推出多模態(tài)方面的更新，將更多 AI 驅(qū)動的工具直接集成到核心產(chǎn)品中。比如這幾個月來，OpenAI 陸續(xù)賦予了 ChatGPT 看(GPT-4V)、聽(Whisper)、說(最新 TTS 技術(shù))、畫(DALL・E)的能力。

　　前幾天，OpenAI 召開了自家的首場開發(fā)者大會。全新升級后的 GPT-4 Turbo API ，將這些多模態(tài)能力開放給了每一位用戶。當(dāng)多模態(tài)能力被整合，必然會催生很多場景化應(yīng)用。

　　何忠江指出，實際場景中的大模型應(yīng)用不僅是一個簡單的對話框，需要與多模態(tài)模型聯(lián)動，才能真正去改變一些工作的流程和思路，提高其效率。而我們此前所熟悉的大模型 —— 語義大模型會是整個通用人工智能的核心，起到類似人類大腦的思考作用。

　　因此，在星辰語義大模型的打造過程中，中國電信同時開發(fā)了星辰多模態(tài)大模型和星辰語音大模型。

　　在這場論壇中，中國電信隆重介紹了星辰多模態(tài)大模型，該模型主要聚焦提升圖文生成、圖文理解能力，訓(xùn)練了超過 12 億各種風(fēng)格數(shù)據(jù)，支持近 20 種繪畫風(fēng)格，中文意象理解生成能力提升 30%，語義細(xì)粒度生成效果提升 25%。

　　此外，星辰語音大模型也是一大亮點。據(jù)介紹，星辰語音大模型基于數(shù)十萬小時語音數(shù)據(jù)進(jìn)行訓(xùn)練，具備精準(zhǔn)的多語種 / 方言語音識別、語音實時自定義敏感詞檢測、超自然多音色語音生成和編輯、聲音匿名等多項語音能力，支持智能會議、智慧辦公、智能客服、智能語音機(jī)器人等多場景解決方案。

　　以「智能客服」為例，何忠江介紹說，此前 TTS 技術(shù)已經(jīng)能夠合成非常優(yōu)美的聲音，但還遠(yuǎn)遠(yuǎn)算不上自然，接電話的人很容易識別出聲音是否由機(jī)器生成，這就是 TTS 技術(shù)在落地智能客服應(yīng)用受到的最大阻礙。據(jù)統(tǒng)計，這類合成人聲的掛斷率甚至達(dá)到 70% 左右。

　　要想破解應(yīng)用的問題，就要依靠技術(shù)創(chuàng)新，達(dá)到「高仿真」。星辰語音大模型目前已經(jīng)實現(xiàn)「超自然人聲合成」，比如下面這段聲音，聽起來和真人發(fā)音別無二致，語氣詞和停頓節(jié)奏都比較還原：

　　在通用模型之外，面向垂直領(lǐng)域的行業(yè)大模型也是各個廠商的「必爭之地」。構(gòu)建一個智能對話框不是最難的，讓大模型融入具體的業(yè)務(wù)、成為新的生產(chǎn)工具更重要。對此，中國電信已早早布局。

　　本次論壇中，中國電信宣布了首批試商用 12 個行業(yè)大模型，包括星辰教育大模型、治理大模型、政務(wù)服務(wù)大模型、應(yīng)急大模型、醫(yī)保大模型、交通大模型、住建大模型、金融大模型、神農(nóng)一號大模型、出行大模型、旅游導(dǎo)覽大模型、礦山大模型。

　　比如星辰教育大模型，這是中國電信基于教育行業(yè)億級服務(wù)數(shù)據(jù)沉淀，訓(xùn)練出具有國家中英文作文特級教師水平的「精準(zhǔn)教學(xué)大模型」，15 秒就能完成一篇中英文作文的打分、點評和改進(jìn)建議，目前已在河南 1.2 萬師生教學(xué)中應(yīng)用并取得良好的效果。再比如星辰基層治理大模型，主要應(yīng)用場景包括矛盾調(diào)節(jié)助手、線上法律顧問和公文助手等，目前已在某些城市的多個基層社區(qū)上線應(yīng)用。

　　通用人工智能，越來越近

　　轉(zhuǎn)眼間，距離 ChatGPT 發(fā)布已經(jīng)快過去一年，熱度卻絲毫未減。究其原因，是因為大模型終于清晰地指出了一條前往通用人工智能的路。

　　一直以來，中國電信都將通用人工智能的目標(biāo)當(dāng)成長期努力的方向。近年來，從視覺、語音、語義到集各種模態(tài)能力于一身的數(shù)字人，中國電信目前已完成了全面布局，很多技術(shù)成果也逐漸投入實際生產(chǎn)使用。

　　談到對通用人工智能的理解，何忠江表示，這仍然是一條漫長的道路，包括「感知智能」、「認(rèn)知智能」、「具身智能」、「群體智能」幾種階段。

　　理想中的人工智能是像人一樣能看、能聽、會思考。借助視覺和語音的技術(shù)，模型把信息采集到以后，核心是要對信息做出判斷，給出下一步的決策思路，這其實就是大語言模型在目前階段起到的作用。

　　當(dāng)這種決策能力落在虛擬空間中的數(shù)字人或是現(xiàn)實空間中的機(jī)器人，就意味著「具身智能」的誕生，假如數(shù)字人和機(jī)器人能夠相互協(xié)作、統(tǒng)籌和調(diào)度，這就意味著「群體智能」誕生了，通用人工智能在這個過程中離我們越來越近。

　　比如在下方這個案例中，星辰語義大模型用來撰寫宣傳主題文案，星辰多模態(tài)大模型用來繪制產(chǎn)品海報，在這個過程中，數(shù)字人起到了下達(dá)指令的作用，也可視為人類的「數(shù)字分身」。

　　最開始，數(shù)字人將任務(wù)描述為：「中國電信有一款最新的產(chǎn)品是直連衛(wèi)星的產(chǎn)品，我們假設(shè)要給這款產(chǎn)品做一些廣告宣傳的文案，我們應(yīng)該通過大模型怎么來做?」短短兩分鐘，一張精美的海報就完成了。

　　面向下一階段的競爭，中國電信的萬億大模型已經(jīng)開啟訓(xùn)練計劃，并預(yù)計將于明年 5 月份完成。據(jù)了解，電信萬億參數(shù)大模型是以「成長策略」進(jìn)行訓(xùn)練，是首個萬億稠密大模型，將擁有更高階的「智能」。

　　可以想象的是，在不遠(yuǎn)的未來，融合語言、視覺和語音等多模態(tài)能力的大模型將會適應(yīng)現(xiàn)實世界中不同模態(tài)的任務(wù)，逐漸接近甚至超越人類的水平。曾經(jīng)只會出現(xiàn)在科幻作品的情節(jié)，終將走進(jìn)現(xiàn)實。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

海報生成中...

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

海藝AI的模型系統(tǒng)在國際市場上廣受好評，目前站內(nèi)累計模型數(shù)超過80萬個，涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景，基本覆蓋所有主流創(chuàng)作風(fēng)格。

OPPO A6l發(fā)布：售價1799元搭載六年長壽大電池

華為Mate X7今日開售：售價12999元起

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

9月9日，國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業(yè)體驗官計劃發(fā)布會。

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機(jī)，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺，同比增長33%，顯示出品類強(qiáng)勁的市場需求。

專題

禮儀主持_商業(yè)活動模特演藝服務(wù)公司
九章智算云Alaya NeW Cloud 2.0發(fā)布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關(guān)于我單位網(wǎng)站被仿冒一

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

幻覺率直降40%，中國電信千億參數(shù)「星辰大模型」炸場，業(yè)界首提緩解多輪幻覺解決方案

最新新聞

熱門新聞

即時

全球頂級AI創(chuàng)作社區(qū)回歸！海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

新聞

市場占比高達(dá)35.8%，阿里云引領(lǐng)中國AI云增長

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗官計劃，助力中小企

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

專題

幻覺率直降40%，中國電信千億參數(shù)「星辰大模型」炸場，業(yè)界首提緩解多輪幻覺解決方案

擴(kuò)展閱讀

最新新聞

熱門新聞