最新發表在《Cureus》雜志上的一項同行評審研究顯示,OpenAI的GPT-4語言模型在未經任何額外訓練的情況下,成功通過了日本國家物理治療考試。
研究人員向GPT-4輸入了1,000個問題,涵蓋記憶、理解、應用、分析和評估等方面。結果顯示,GPT-4總體上正確回答了73.4%的問題,通過了所有五個測試部分。然而,研究也揭示了AI在某些領域的局限性。
GPT-4在一般問題上表現出色,正確率達80.1%,但在實際問題上僅為46.6%。同樣,它在處理純文本問題(80.5%正確)方面遠優于帶有圖片和表格的問題(35.4%正確)。這一發現與先前關于GPT-4視覺理解局限性的研究結果一致。
值得注意的是,問題難度和文本長度對GPT-4的性能影響不大。盡管該模型主要使用英語數據訓練,但在處理日語輸入時也表現良好。
研究人員指出,雖然這項研究展示了GPT-4在臨床康復和醫學教育方面的潛力,但仍需謹慎看待。他們強調,GPT-4并不能正確回答所有問題,未來還需要評估新版本以及該模型在書面和推理測試中的能力。
此外,研究人員提出,像GPT-4v這樣的多模態模型可能在視覺理解方面帶來進一步的改進。目前,谷歌的Med-PaLM2、Med-Gemini等專業醫療AI模型,以及Meta基于Llama3的醫療模型都在積極開發中,旨在在醫療任務中超越通用模型。
然而,專家們認為,醫療AI模型要廣泛應用于實踐可能還需要很長時間。當前模型的誤差空間在醫療環境中仍然過大,需要在推理能力上取得顯著進步,才能安全地將這些模型整合到日常醫療實踐中。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。