預訓練的大型語言模型(LLM)如 GPT-4和 Gemini 備受組織關注,他們渴望利用 LLM 構建聊天機器人、副駕駛等應用。根據麻省理工科技評論的最新報告,名為 “C 級領導人的 AI 準備情況”,該報告是代表 ETL 供應商 Fivetran 進行的調查發現,將 AI 或 GenAI 擴展是82% 受訪高管的 “首要任務”。
調查發現,83% 的組織已經確定了要用于 AI 或 GenAI 的數據來源。但是,組織在實際連接 GenAI 并在需要時、以適當格式、清潔和準備充分地向 GenAI 應用程序提供數據方面準備得如何,存在疑問。同時還需要確保不會危及隱私或安全。
報告指出,平均來說,組織需要 “超過十幾種不同的技術來收集關于其數據的所有智能信息,相同數量的技術來集成、轉換和復制數據”,這帶來了巨大的困難。由于過去為中心化數據倉庫項目開發的數據集成和 ETL 工具可能不適合新的 GenAI 用例,因此獲取更好的數據集成和 ETL / 數據管道工具顯然是一項重要任務。
此外,調查發現,雖然64% 的調查對象表示數據集成和 ETL / 管道工具是其前兩個 GenAI 投資重點之一,但35% 的人將數據湖視為優先事項,而31% 的人將數據轉換工具視為優先事項。數據目錄和 LLM 投資的份額僅為7%,而矢量數據庫和計算層位于中間位置。組織在構建數據基礎時面臨著許多挑戰,包括數據集成和構建數據管道、數據治理和安全以及數據質量等問題。
調查還發現,組織在數據治理、合規和報告方面存在諸多挑戰。大量調查對象指出,準備數據供 AI 使用的最大挑戰是數據治理和安全(44% 的受訪者提到),以及數據集成或管道(45% 的受訪者提到)。然而,深入調查數據卻顯示了一種明顯的分歧。特別是,調查顯示,對安全和治理的積極關注主要集中在政府和金融服務機構,而在制造業、零售業和其他行業的科技高管中,對安全和治理的擔憂并沒有同樣的比例。
“組織可能無法控制某人在業務應用程序中使用數據并將其發送給生成式 AI 模型。這些都是重要的問題。” 調查報告引述 IDC 的 Bond 在報告中說道。建立強大的數據基礎是 GenAI 成功的前提條件。如果組織不先構建堅實的數據基礎,他們的數據科學家將在基本的數據集成和清理工作上浪費時間。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。