英偉達與Ineffable Intelligence合作共建強化學習基礎設施
英偉達官宣與倫敦AI實驗室Ineffable Intelligence達成技術合作,雙方將聯合研發強化學習專用基礎設施,為高階人工智能研發搭建底層技術框架。這家新晉AI實驗室由AlphaGo核心研發人員David Silver創辦,近期剛結束封閉研發階段、正式對外公開。
英偉達CEO黃仁勛提出,AI下一階段的發展核心是具備持續經驗學習能力的智能體。本次合作將針對性優化大規模強化學習底層架構,助力新一代智能系統技術迭代。作為強化學習領域資深研究者,David Silver正推動該技術形成全新AI研發范式。
David Silver表示,目前AI 已可學習并復用人類現有知識,而行業下一難點,是研發可自主積累、探索新知識的智能模型,這類模型依托實踐經驗完成自我迭代學習。
從技術層面來看,強化學習的運行邏輯區別于傳統模型預訓練。傳統預訓練依托固定數據集完成訓練,而強化學習可實時生成訓練數據,持續循環完成動作執行、狀態監測、效果評估以及參數迭代。該工作負載對芯片互連傳輸、內存帶寬、任務調度性能要求更高;且訓練數據區別于常規人類語言數據,需要定制專屬模型架構與訓練算法。
兩家企業工程團隊將共同研發適配規模化運行的強化學習訓練鏈路。本次合作將基于英偉達Grace Blackwell平臺開展研發工作,同時優先適配尚未發布的Vera Rubin平臺。雙方意在搭建新一代軟硬件體系,降低AI對現有人類數據的依賴,適配仿真訓練、經驗自主迭代的研發趨勢。
這套專用基礎設施落地后,可支撐強化學習模型在復雜場景中規模化運行,推動智能體在多領域實現技術創新。


評論