国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

Intel安裝首套二代High-NA EUV:為14A鋪平道路華為首款100W自帶線充電寶熊貓和花限定版發(fā)布 399元 12000mAh抖音升級(jí)批量舉報(bào)工具:?jiǎn)未慰商峤?000條內(nèi)容2025浪潮計(jì)算機(jī)智慧算力創(chuàng)新發(fā)展論壇圓滿舉辦豆包AI手機(jī)恢復(fù)銷售,僅有少量名額且無擴(kuò)大生產(chǎn)計(jì)劃千億賽道爆發(fā)前夜,智能眼鏡供應(yīng)鏈暗藏機(jī)遇新局面!2026年,全球彩電TOP5名單或?qū)ⅰ吧儭?/a>耀目雙星設(shè)計(jì)暗示前后雙紅楓,超級(jí)nova 15系列還有哪些重磅升級(jí)?三大策略助力基礎(chǔ)設(shè)施和運(yùn)營(yíng)團(tuán)隊(duì)成功擁抱生成式 AI百度百舸持續(xù)開源生產(chǎn)級(jí)代碼,聯(lián)合 SGLang 社區(qū)打造先進(jìn) AI Infra中國(guó)移動(dòng)多項(xiàng)自智網(wǎng)絡(luò)創(chuàng)新成果登頂TM Forum全球評(píng)測(cè)榜單蔚來能源與中安能源首批共建50座充換電站投入運(yùn)營(yíng)掌舵新出海時(shí)代:從“流量水手”到“品牌船長(zhǎng)”服裝店收銀系統(tǒng)2026年適配指南:三種模式對(duì)應(yīng)的最優(yōu)選Dell PowerScale新增pNFS支持,為現(xiàn)代化工作負(fù)載帶來革命性并行性能L4級(jí)自動(dòng)駕駛企業(yè)白犀牛宣布完成新一輪融資清退?漲價(jià)?小米、安克、綠聯(lián)集體迎新規(guī),充電寶大洗牌抖音“偷襲”支付寶單季收入首破600億,2025年騰訊游戲“鐵王座”更穩(wěn)了?智馭交通·未來之路:“AIR+交通”專場(chǎng)活動(dòng)成功舉辦
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    壓縮ChatGPT等模型文本提示,極大節(jié)省AI算力

    2023年10月25日 17:43:03 來源:微信公眾號(hào)AIGC開放社區(qū)

      本文來自于微信公眾號(hào) AIGC開放社區(qū)(ID:AIGCOPEN),作者:AIGC開放社區(qū)。

      在長(zhǎng)文本場(chǎng)景中,ChatGPT等大語言模型經(jīng)常面臨更高算力成本、更長(zhǎng)的延遲以及更差的性能。為了解決這三大難題,微軟開源了LongLLMLingua。

      據(jù)悉,LongLLMLingua的核心技術(shù)原理是將“文本提示”實(shí)現(xiàn)最高20倍的極限壓縮,同時(shí)又可以準(zhǔn)確評(píng)估提示中內(nèi)容與問題的相關(guān)程度,消除無關(guān)內(nèi)容保留關(guān)鍵信息,達(dá)到降本增效目的。

      實(shí)驗(yàn)結(jié)果顯示,經(jīng)過LongLLMLingua壓縮后的提示,比原始提示的性能提升了17.1%,同時(shí)輸入GPT-3.5-Turbo的tokens減少了4倍。在LongBench和ZeroScrolls測(cè)試中顯示,每1,000個(gè)樣本節(jié)省28.5美元和27.4美元的成本。

      當(dāng)壓縮約10k tokens的提示,壓縮率在2-10倍范圍內(nèi)時(shí),端到端延遲可以降低1.4-3.8倍,顯著加速了推理速率。

      從介紹論文來看,LongLLMLingua主要由問題感知的粗細(xì)粒度壓縮、文檔重排序、動(dòng)態(tài)壓縮比率和壓縮后子序列恢復(fù)4大模塊組成。

      問題感知的粗粒度壓縮模塊

      該模塊的設(shè)計(jì)思路是,使用問題文本進(jìn)行條件化,評(píng)估每個(gè)段落與問題的相關(guān)程度,保留相關(guān)度更高的段落。

      具體來說,通過計(jì)算問題文本與各段落的條件困惑度,判斷二者的邏輯關(guān)聯(lián)程度,條件困惑度越低表示相關(guān)性越高。

      在此基礎(chǔ)上,設(shè)置閾值保留困惑度較低的段落,過濾掉與問題不相關(guān)的段落。這實(shí)現(xiàn)了根據(jù)問題快速移除大量冗余信息的粗粒度壓縮。

      文檔重排序模塊

      研究表明,在提示中,靠近開始和結(jié)束位置的內(nèi)容對(duì)語言模型的影響最大。所以該模塊根據(jù)各段落的相關(guān)程度對(duì)其進(jìn)行重新排序,使關(guān)鍵信息出現(xiàn)在對(duì)模型更敏感的位置,減少中間位置信息損失。

      通過利用粗粒度壓縮模塊計(jì)算出的各段落與問題的關(guān)聯(lián)度,對(duì)段落進(jìn)行排序,使關(guān)聯(lián)度最高的段落排在最前面。這進(jìn)一步增強(qiáng)了模型對(duì)關(guān)鍵信息的感知。

      在獲取重排序后的相關(guān)段落后,需要進(jìn)一步壓縮每個(gè)段落內(nèi)的詞量。此時(shí)動(dòng)態(tài)壓縮比率模塊對(duì)提示進(jìn)行精細(xì)調(diào)控。

      動(dòng)態(tài)壓縮比率模塊

      對(duì)更相關(guān)的段落使用更低的壓縮比率,分配更多的保留詞語預(yù)算,而對(duì)相關(guān)性較弱的段落則使用更高的壓縮比率。

      通過利用粗粒度壓縮結(jié)果中的段落關(guān)聯(lián)度,動(dòng)態(tài)確定每個(gè)段落的壓縮比率。關(guān)聯(lián)度最高的段落壓縮比率最低,依次類推。

      實(shí)現(xiàn)自適應(yīng)、細(xì)粒度的壓縮控制,有效保留關(guān)鍵信息。壓縮后還需要提高結(jié)果的可靠性,這就需要下面的壓縮后子序列恢復(fù)模塊。

      壓縮后子序列恢復(fù)模塊

      在壓縮過程中,一些關(guān)鍵詞可能被過度刪除,影響信息的完整性,而該模塊可以檢測(cè)并恢復(fù)這些關(guān)鍵詞。

      工作原理是,利用源文本、壓縮文本、生成文本之間的子序列關(guān)系,從生成結(jié)果中恢復(fù)完整的關(guān)鍵名詞詞組,修復(fù)壓縮帶來的信息缺失,提高結(jié)果的準(zhǔn)確性。

      整個(gè)過程有點(diǎn)像我們快速瀏覽文章、篩選信息、整合要點(diǎn)的工作流程等,使模型快速捕捉文本的關(guān)鍵信息,生成高質(zhì)量的摘要。

      LongLLMLingua實(shí)驗(yàn)數(shù)據(jù)

      研究人員構(gòu)建了一個(gè)基于Natural Questions的多文檔問答數(shù)據(jù)集,其中每個(gè)示例包含一個(gè)問題及20個(gè)相關(guān)文檔,并需要從這20個(gè)文檔中查找到答案。

      該數(shù)據(jù)集模擬了實(shí)際的搜索引擎和問答場(chǎng)景,可以評(píng)估模型在長(zhǎng)文檔中的問答性能。

      此外,研究人員還采用了更為通用的長(zhǎng)文本理解基準(zhǔn)測(cè)試集,包括LongBench和ZeroSCROLLS,以評(píng)估方法在更廣泛場(chǎng)景下的效果。

      其中,LongBench覆蓋單文檔問答、多文檔問答、文本摘要、少樣本學(xué)習(xí)等任務(wù),包含英文數(shù)據(jù)集。ZeroSCROLLS則包括文本摘要、問答理解、情感分析等典型語言理解任務(wù)。

      在這些數(shù)據(jù)集上,研究人員比較了LongLLMLingua壓縮后的提示與原始提示在大語言模型上的性能。同時(shí),也與其他提示壓縮方法進(jìn)行了對(duì)比,如基于困惑度的LLMLingua和基于檢索的方法,評(píng)估了LongLLMLingua的有效性。

      實(shí)驗(yàn)結(jié)果顯示,LongLLMLingua壓縮后的提示在問答準(zhǔn)確率、生成文本質(zhì)量等指標(biāo)上普遍優(yōu)于原始提示。

      例如,在NaturalQuestions上,壓縮4倍的提示提升了17.1%的問答準(zhǔn)確率。當(dāng)壓縮約10k tokens的提示,壓縮率在2-10倍范圍內(nèi)時(shí),端到端延遲可以降低1.4-3.8倍。這充分證明LongLLMLingua可以在壓縮提示的同時(shí)提升關(guān)鍵信息提取。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    海報(bào)生成中...

    最新新聞

    熱門新聞

    即時(shí)

    全球頂級(jí)AI創(chuàng)作社區(qū)回歸!海藝AI國(guó)內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場(chǎng)占比高達(dá)35.8%,阿里云引領(lǐng)中國(guó)AI云增長(zhǎng)

    9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃,助力中小企

    9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動(dòng)圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |