大模型的人才黑洞效應,還在持續。最新出現在大模型大牛轉會名單上的重磅大牛,是 90 后 AI 大牛張祥雨,ResNet (殘差神經網絡)四位作者之一,孫劍首位深度學習博士生,未來科學大獎得主。現在,他出現在了國產大模型獨角獸階躍星辰的引援傳聞中。
而且六小強之一的階躍星辰,據說最近還不止這一位 AI 大牛。不過截至發稿,階躍星辰暫未作出明確回應。
張祥雨,ResNet 四位作者之一
2008 年,張祥雨考入西安交通大學;一年后申請轉專業進入軟件工程專業學習。
2011 年,張祥雨獲美國大學生數學建模競賽(MCM)特等獎提名獎(Finalist),創下當時西安交通大學參加該競賽以來歷史最好成績。
2012 年,張祥雨獲西安交通大學軟件學院軟件工程專業學士學位。
之后張祥雨又入選了西安交通大學與微軟亞洲研究院博士生聯合培養項目,師從孫劍和何愷明。2017 年,獲得博士學位。
正是在微軟亞洲研究院期間,何愷明、孫劍、任少卿和張祥雨四人共同完成了著名的 ResNet,張祥雨負責底層框架和編碼。
ResNet 即殘差學習,本身雖為計算機視覺領域研究,但其核心思想殘差連接已經跨界成為現代深度學習模型的基本組件。
開啟上一次 AI 熱潮的 AlphaGo Zero 就是結合了 ResNet + 強化學習 + 蒙特卡洛搜索共同完成。
而開啟最新 AI 熱潮的 ChatGPT,其中的“T”也就是 Transformer 網絡中同樣使用了殘差連接。
ResNet 原始論文在 2016 就獲得了 CVPR 最佳論文獎。
去年,何愷明、孫劍、任少卿和張祥雨四人又憑借這項研究獲得了 2023 未來科學大獎“數學與計算機科學獎”,由此可見其深遠影響。
目前這篇論文 Google Scholar 的被引用次數已超 23 萬,是本世紀最火的深度學習論文之一:
2016 年 7 月,孫劍加入曠視,任首席科學家和曠視研究院負責人。張祥雨在博士畢業后也緊隨導師進入了曠視。
張祥雨研究方向包括高性能卷積網絡設計、AutoML 與自動化神經網絡架構搜索、深度模型的裁剪與加速。
2017、18 年,張祥雨完成了另一代表作 —— 移動端高效卷積神經網絡 ShuffleNet 兩部曲。
現月之暗面聯合創始人、算法團隊負責人周昕宇,也是共同一作。
ShuffleNet 后來影響了包括蘋果 3D 人臉解鎖在內的各種手機毫秒級人臉解鎖技術。
2020 年,張祥雨入選“AI 2000 計算機視覺全球最具影響力學者”榜單第 4 位。
除此之外,張祥雨還有諸多研究,Google Scholar 數據顯示,目前其論文引用量達到 320510 次,h-index 為 59。
還有 2 位萬引大牛加盟
2024 年,AI 牛人的流動沒有減少,但他們的選擇不全是下場創業。
行業中人往往對 AI 技術有很強烈的親身感受。他們中還有許多像張祥雨這樣,選擇前往既有公司,到新潮流一線激情沖浪的人。
而階躍星辰,就在悄然之間招攬了不少這種選擇的牛人。
量子位獲悉,除了張祥雨,騰訊俞剛和 MSRA 段楠,也已經加入階躍星辰的隊伍。
俞剛,現任階躍星辰首席科學家。
在此之前,他在騰訊擔任研究總監;再之前,他是曠視 Detection 組長。
俞剛 2007 年本科畢業于山東大學,2010 年在上海交通大學獲得計算機碩士學位。
之后前往南洋理工大學攻讀博士學位,師從袁浚菘;期間曾在微軟研究院實習,2014 年畢業后加入曠視工作。
主要負責檢測、分割、跟蹤、骨架、動作行為等方面的研究以及算法落地工作。
2017 年,俞剛帶隊參加 2017 COCO+Places 挑戰賽,獲得檢測第一名,人體姿態估計第一名;2018 年再次帶隊參加 COCO+Mapillary 挑戰賽,獲四項第一。
曠視五年期間,俞剛和曠視首席科學家、曠視研究院院長孫劍合著過十篇 paper。
2019 年年底,俞剛在知乎確認離職消息,宣布加入騰訊 PCG 光影研究室,繼續從事 CV 相關算法及技術研究。
今年,俞剛有 2 篇論文被 ECCV2024 接收、2 篇論文被 CVPR 接收;同時,他也擔任了 CVPR 的區域主席。
目前,俞剛的谷歌學術被引量為 1.9 萬。
再來說 MSRA 段楠 —— 其實今年 5 月,量子位就跟大家分享過他加入階躍星辰的訊息。
離職前,段楠是 MSRA 資深首席研究員,自然語言計算團隊研究經理。
主要從事自然語言處理、多模態智能、代碼智能、機器推理等研究,多次擔任 NLP / AI 學術會議程序主席和領域主席。
同時是中國科學技術大學、西安交通大學兼職博導,天津大學兼職教授。
段楠從天津大學博士畢業后就加入 MSRA,當今 NLP 領域成就最高的華人之一、MSRA 前副院長周明是他的導師。
他在 MSRA 工作了 17 年零 9 個月。
工作期間,段楠的多項研究成果成功應用到微軟 AI 產品中,包括必應搜索、必應廣告、微軟新聞、Cortana 語音助手和微軟小冰等。
他的研究工作還有微軟 NüWA(女媧),由 MSRA 和北大聯合打造的多模態預訓練模型,面世則直取 8 項 SOTA。
據了解,段楠擔責的職務是 NüWA 系列模型家族項目擔任研究組長和導師。
目前,段楠的 Google Scholar 被引量,也逼近 1.9 萬。
另有統計結果顯示,段楠與微軟前全球副總裁、階躍星辰創始人 CEO 姜大昕,合著過 44 篇論文。
大模型創業,AI 人才新黑洞
幾個月時間,把張祥雨、俞剛、段楠收入囊中,還有更多的 AI 人才加入消息秘而不宣。
階躍星辰必然是有兩把刷子在身上的。
究其原因,首先是其頗受認可的江湖地位。
階躍星辰已經是公認的國產大模型創企“六小強”之一:
和月之暗面、Minimax、智譜華章、零一萬物、百川智能一起,深耕基礎模型領域,并因人才、技術、產品、市場認可度綜合評價,估值快速躍遷至 10 億美金以上。
6 月時,階躍星辰在投融資市場中的身價,曝已是 20 億美元。
再就是出場就很吸引人的人才堡壘。
創始人兼 CEO 姜大昕,微軟前全球副總裁。
不談其他,單純看他在微軟的最后 title,就很能理解為什么許多與 MSRA 有千絲萬縷聯系的 AI 牛人門,前赴后繼奔向階躍星辰懷抱中(一個狗頭)。
2011 年,姜大昕開始在微軟亞洲互聯網工程院(STCA)工作,去年 3 月升任為微軟副總裁,同時兼任亞洲軟件技術中心 WebXT S+D(網絡體驗、搜索和分銷)集團總經理。
然后在事業新高峰時依然下場創業,有了今日的階躍星辰。
階躍星辰的數據負責人焦斌星,就是和姜大昕一起打包自己,從微軟投身 AI 新浪潮創業的一份子。
這家公司的系統負責人朱亦博,也曾有過 MSRA 的工作經歷。
更重要的是,他是國內屈指可數的、擁有多次單集群萬卡以上的系統建設與管理實踐經驗的從業者。
以及離不開的壘雪球神器 —— 階躍自研模型和產品。
其模型側的 Step 系列通用大模型,以及躍問 & 冒泡鴨兩款 toC 產品,陸陸續續投入市場,進行檢驗,正在獲得更大的認可。
以上或許能解釋,為什么階躍星辰成為了我們看到的“AI 人才黑洞”。
而階躍星辰對人才的吸引力,正是大模型六小強瘋狂“斂(人)才”的原因的縮影。
人才的流動,還會繼續。
本文來自微信公眾號:量子位(ID:QbitAI),作者:衡宇西風
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。