該研究創新構建了一種面向稀疏矩陣計算的密集計算范式,系統化解構了傳統稀疏直接求解器的性能瓶頸。團隊通過將分散的非零元整合為更加規整的密集數據塊,將不規則稀疏矩陣映射為統一稠密的大塊結構,進而采用基于稠密矩陣運算的數值分解算法,取代傳統稀疏運算中聚合非零小分塊的碎片化計算模式,顯著降低了由不規則內存訪問引發的計算與調度開銷,最終實現了計算效率與硬件利用率的協同優化。

  該方案的順利落地,深度依賴于鯤鵬平臺的計算特性。硬件層面,鯤鵬920新型號集成專用矩陣運算單元,原生具備高密度數值分解運算的高效承載能力,可精準匹配密集數據塊的集中化處理需求;其多核架構為大規模密集數據塊的并行運算提供了堅實基礎,避免算力閑置或過載。軟件層面,鯤鵬 KML 數學庫針對密集型矩陣運算進行深度優化,通過底層算法與硬件架構的協同,進一步放大了密集運算模式的性能潛力。經 70 余個跨領域測試集驗證,該方案性能較SuperLU 求解器平均加速32.2倍,在基礎硬件配置下實現了平均 9.6 倍性能加速,大幅壓縮了科學計算的時間成本。

  目前,相關研究成果已發表于 CCF B 類國際會議 Euro-Par 2025,其核心技術已申請中國發明專利并獲得授權。此次成果是鯤鵬平臺在科學計算領域的典型實踐,該方法對于現代高性能處理器上稀疏計算問題的高效求解、充分地發揮處理器上的矩陣運算單元具有很好的應用價值。未來,隨著鯤鵬生態的持續完善,其在高性能計算領域的賦能作用將進一步凸顯,助力更多科研團隊突破技術難關,推動科研成果加速落地轉化。

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

[No.H002]
瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |