3月4日 消息:北大團(tuán)隊(duì)聯(lián)合兔展啟動(dòng)了復(fù)現(xiàn)Sora的計(jì)劃,該項(xiàng)目名為Open Sora。這一舉措的背后是資源有限的情況下,團(tuán)隊(duì)希望匯集開源社區(qū)的力量,以盡可能完成復(fù)現(xiàn)工作。
項(xiàng)目的核心團(tuán)隊(duì)由北大信息工程學(xué)院助理教授袁粒和北大計(jì)算機(jī)學(xué)院教授田永鴻等領(lǐng)導(dǎo),共有13名成員。除了團(tuán)隊(duì)成員外,北大校友和AnimateDiff貢獻(xiàn)者等也積極響應(yīng),并有人表示愿意提供高質(zhì)量的數(shù)據(jù)集。
關(guān)于Sora的復(fù)現(xiàn)技術(shù)細(xì)節(jié)已經(jīng)公布,項(xiàng)目框架包括三個(gè)主要部分:Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
為了解決Sora視頻的可變長寬比問題,團(tuán)隊(duì)采用了上海AI Lab提出的FiT技術(shù),實(shí)施了一種動(dòng)態(tài)掩碼策略。同時(shí),團(tuán)隊(duì)還通過位置插值來處理可變分辨率,并使用Video VQ-VAE來支持可變時(shí)長的視頻處理。團(tuán)隊(duì)已經(jīng)初步實(shí)現(xiàn)了三個(gè)功能,并在項(xiàng)目主頁上提供了兩個(gè)demo,展示了10秒和18秒視頻的重建效果。
盡管已經(jīng)取得了一些進(jìn)展,但團(tuán)隊(duì)面臨著諸多挑戰(zhàn)。目前的訓(xùn)練是在8個(gè)A100-80G上進(jìn)行的,但仍然遠(yuǎn)遠(yuǎn)不夠,而且需要更多的數(shù)據(jù)和GPU進(jìn)行訓(xùn)練。團(tuán)隊(duì)已經(jīng)完成了一些任務(wù),包括采樣腳本和在embeddings上添加類條件,但仍有一些待辦事項(xiàng)需要完成。
項(xiàng)目的領(lǐng)銜者之一是袁粒,他是北大信息工程學(xué)院的助理教授,曾獲得福布斯30歲以下亞洲杰出人物榜單的榮譽(yù)。另一位領(lǐng)銜者是田永鴻,他是北京大學(xué)博雅特聘教授,擁有豐富的科研經(jīng)驗(yàn)和榮譽(yù)。
關(guān)于誰能率先發(fā)布中文版Sora的問題,目前仍然是一個(gè)未解之謎。在業(yè)內(nèi),有傳言稱字節(jié)可能會(huì)成為首個(gè)發(fā)布中文版Sora的公司。盡管有一些AI模型類似于Sora,比如最近出現(xiàn)的Boximator和Dreamina,但它們與Sora仍存在一定差距。然而,這個(gè)問題的答案還有待時(shí)間的揭曉。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場(chǎng),1H25》報(bào)告。中國AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。