從構(gòu)建軟件到構(gòu)建學(xué)習(xí)系統(tǒng)
認(rèn)真完成這一轉(zhuǎn)型的企業(yè),收獲的將不只是更優(yōu)秀的功能,而是一種可復(fù)利的結(jié)構(gòu)性?xún)?yōu)勢(shì),且會(huì)隨著每一輪部署周期不斷擴(kuò)大。
在軟件工程的大部分歷史里,我們一直遵循一種看似簡(jiǎn)單的模式:工程師定義行為,系統(tǒng)執(zhí)行行為;行為出錯(cuò)時(shí)工程師修復(fù),需求變更時(shí)工程師重寫(xiě)。在版本發(fā)布之間,系統(tǒng)是靜態(tài)的 —— 它不會(huì)從生產(chǎn)環(huán)境的觀測(cè)中學(xué)習(xí),不會(huì)適配用戶(hù)真實(shí)行為,也不會(huì)自主優(yōu)化。
這種模式正在過(guò)時(shí)。不是因?yàn)楣こ處煴蝗〈撬麄兯鶚?gòu)建的系統(tǒng)在本質(zhì)上發(fā)生了改變。新一代軟件系統(tǒng)會(huì)從運(yùn)行產(chǎn)生的數(shù)據(jù)中持續(xù)學(xué)習(xí),通過(guò)強(qiáng)化學(xué)習(xí)與結(jié)構(gòu)化實(shí)驗(yàn)自主優(yōu)化行為,某些場(chǎng)景下甚至能在運(yùn)行時(shí)自動(dòng)生成并部署代碼。
軟件工程正從構(gòu)建軟件轉(zhuǎn)向構(gòu)建學(xué)習(xí)系統(tǒng)。這一變革的重要性,堪比當(dāng)年從瀑布開(kāi)發(fā)轉(zhuǎn)向敏捷開(kāi)發(fā)。這是我在里約熱內(nèi)盧舉辦的2026 國(guó)際軟件工程大會(huì)(ICSE) 上的核心觀點(diǎn),本文將結(jié)合已落地實(shí)踐的企業(yè),進(jìn)一步展開(kāi)解讀。
關(guān)鍵區(qū)別:用 AI 的系統(tǒng) vs 會(huì)持續(xù)學(xué)習(xí)的系統(tǒng)
我們必須清晰區(qū)分兩類(lèi)系統(tǒng):
大多數(shù)企業(yè)只做到了在產(chǎn)品里嵌入 AI 模型,提升預(yù)測(cè)能力、推出更智能的功能。
極少企業(yè)做到了打造能自動(dòng)閉環(huán) “部署 — 優(yōu)化” 的生產(chǎn)系統(tǒng),無(wú)需工程師手動(dòng)采集數(shù)據(jù)、重新訓(xùn)練、重新發(fā)布。
兩者不是程度差異,而是架構(gòu)差異。
學(xué)習(xí)系統(tǒng)把每一次生產(chǎn)交互當(dāng)作訓(xùn)練信號(hào),每一次發(fā)布當(dāng)作一次實(shí)驗(yàn),每一次失敗當(dāng)作反饋。構(gòu)建它需要全新的設(shè)計(jì)模式、基礎(chǔ)設(shè)施,以及對(duì)軟件工程本質(zhì)的重新理解。
四大技術(shù)融合,讓規(guī)模化學(xué)習(xí)系統(tǒng)成為可能
1. 強(qiáng)化學(xué)習(xí)(RL)
監(jiān)督學(xué)習(xí)需要提前準(zhǔn)備標(biāo)注數(shù)據(jù),而強(qiáng)化學(xué)習(xí)讓系統(tǒng)在實(shí)踐中學(xué)習(xí):執(zhí)行動(dòng)作、觀測(cè)結(jié)果、朝著更優(yōu)方向更新行為。
在內(nèi)容推薦、物流路徑、網(wǎng)絡(luò)優(yōu)化等序列決策場(chǎng)景,這是顛覆性能力升級(jí)。用 RL 優(yōu)化配送路線(xiàn)的系統(tǒng),不需要工程師告訴它最優(yōu)路徑,而是通過(guò)實(shí)測(cè)、評(píng)估、持續(xù)迭代找到最優(yōu)解。
Ray 分布式計(jì)算框架背后的Anyscale,通過(guò) RLlib 讓工業(yè)級(jí)強(qiáng)化學(xué)習(xí)可工程化落地。Grab、愛(ài)立信、摩根大通等都在這套基礎(chǔ)設(shè)施上運(yùn)行實(shí)時(shí)強(qiáng)化學(xué)習(xí)任務(wù),Physical Intelligence 也用它訓(xùn)練機(jī)器人系統(tǒng)。
Anyscale 證明:RL 不再是局限于游戲基準(zhǔn)的科研玩具,而是已在關(guān)鍵業(yè)務(wù)流程中規(guī)?;\(yùn)行的工程能力。
2. 聯(lián)邦學(xué)習(xí)(FL)
它解決了 AI 商業(yè)化以來(lái)的結(jié)構(gòu)性難題:世界上最有價(jià)值的數(shù)據(jù)大多不能移動(dòng)。
醫(yī)療記錄受隱私法規(guī)約束
金融交易受保密協(xié)議限制
工業(yè)設(shè)備傳感器數(shù)據(jù)歸客戶(hù)所有
車(chē)輛遙測(cè)數(shù)據(jù)分散在全球各地
傳統(tǒng) AI 訓(xùn)練需要集中數(shù)據(jù),導(dǎo)致絕大多數(shù)高價(jià)值企業(yè)場(chǎng)景無(wú)法使用。
聯(lián)邦學(xué)習(xí)完全顛覆這一邏輯:不把數(shù)據(jù)搬到模型,而是把模型分發(fā)到數(shù)據(jù)所在端側(cè);本地完成訓(xùn)練,只回傳模型的數(shù)學(xué)更新量,不傳輸原始數(shù)據(jù),再聚合為全局共享模型。
來(lái)自劍橋大學(xué)研究、由 Felicis、Mozilla Ventures、Hugging Face CEO 等投資的Flower Labs,打造了全球最流行的開(kāi)源聯(lián)邦學(xué)習(xí)框架,諾基亞、保時(shí)捷、三星、Brave 均已商用,曾支持1500 萬(wàn)客戶(hù)端同時(shí)實(shí)驗(yàn)。
對(duì)汽車(chē)、醫(yī)療、金融、工業(yè)物聯(lián)網(wǎng)等數(shù)據(jù)分散、敏感、受監(jiān)管的軟件密集型企業(yè),F(xiàn)lower 打開(kāi)了利用此前無(wú)法觸及的數(shù)據(jù)訓(xùn)練 AI 的通道。
其競(jìng)爭(zhēng)意義重大:能用私有分布式數(shù)據(jù)訓(xùn)練的企業(yè),將擁有對(duì)手僅靠公開(kāi) / 集中數(shù)據(jù)無(wú)法匹敵的 AI 系統(tǒng)。
3. 運(yùn)行時(shí)代碼生成與自愈
這是四項(xiàng)技術(shù)中商業(yè)化成熟度最低,但對(duì)軟件工程學(xué)科理論意義最大的一項(xiàng)。
傳統(tǒng)軟件失敗只有兩種:明顯崩潰(可檢測(cè)修復(fù))或靜默退化(難以發(fā)現(xiàn))。
學(xué)習(xí)系統(tǒng)可以做到:遇到從未見(jiàn)過(guò)的運(yùn)行時(shí)故障,動(dòng)態(tài)生成處理邏輯、自動(dòng)部署修復(fù)、無(wú)需人工干預(yù)繼續(xù)運(yùn)行。
多所高校研究團(tuán)隊(duì)已用大模型在原型系統(tǒng)中驗(yàn)證:結(jié)合錯(cuò)誤上下文、程序狀態(tài)、預(yù)期行為,在運(yùn)行時(shí)生成異常處理策略。
商用層面,Cursor、Windsurf 等系統(tǒng)已朝此方向演進(jìn),但仍需開(kāi)發(fā)者輔助,尚未完全自治。
研究與生產(chǎn)落地仍有差距,但方向明確:能自主響應(yīng)故障并修改自身的系統(tǒng),與需要人工恢復(fù)的系統(tǒng)有本質(zhì)區(qū)別。
4. 系統(tǒng)化 A/B 實(shí)驗(yàn)
這是最被低估的技術(shù)。
大多數(shù)企業(yè)只在產(chǎn)品經(jīng)理有假設(shè)時(shí)偶爾做實(shí)驗(yàn);而高速學(xué)習(xí)型企業(yè)把實(shí)驗(yàn)變成持續(xù)化、結(jié)構(gòu)化:
每一次發(fā)布都是實(shí)驗(yàn)
每一次系統(tǒng)決策都是可驗(yàn)證假設(shè)
從觀測(cè)到優(yōu)化的鏈路全自動(dòng)運(yùn)行
這不僅是工具變化,更是軟件系統(tǒng)優(yōu)化理念的升級(jí)。
巴黎創(chuàng)立的Kameleoon是歐洲頂尖實(shí)驗(yàn)平臺(tái),將特性開(kāi)關(guān)、A/B 測(cè)試、多變量實(shí)驗(yàn)、實(shí)時(shí) AI 定向投放整合在一體。其架構(gòu)核心理念:實(shí)驗(yàn)與個(gè)性化不是割裂行為 —— 實(shí)驗(yàn)信號(hào)優(yōu)化下一輪定向,用戶(hù)行為數(shù)據(jù)指導(dǎo)下一輪測(cè)試。
每年運(yùn)行數(shù)千次實(shí)驗(yàn)的企業(yè),學(xué)習(xí)速度與只做幾十次的企業(yè)完全不在一個(gè)量級(jí)。
四大技術(shù)合一:形成可復(fù)利的學(xué)習(xí)架構(gòu)
單獨(dú)看只是工具,組合起來(lái)則構(gòu)成完整學(xué)習(xí)架構(gòu):
強(qiáng)化學(xué)習(xí)需要獎(jiǎng)勵(lì)信號(hào),來(lái)自對(duì)用戶(hù)與系統(tǒng)行為的持續(xù)觀測(cè)
聯(lián)邦學(xué)習(xí)處理分布式數(shù)據(jù),產(chǎn)出的模型可通過(guò) RL 與實(shí)驗(yàn)持續(xù)優(yōu)化
運(yùn)行時(shí)代碼生成讓故障閉環(huán)速度遠(yuǎn)超人工開(kāi)發(fā)周期
系統(tǒng)化 A/B 實(shí)驗(yàn)在全量發(fā)布前用真實(shí)行為驗(yàn)證每一次改動(dòng),形成數(shù)據(jù)飛輪,讓每一輪學(xué)習(xí)迭代質(zhì)量復(fù)利提升
每項(xiàng)技術(shù)都在放大其他技術(shù)的效果,共同定義了:什么是學(xué)習(xí)系統(tǒng),而非靜態(tài)系統(tǒng)。
構(gòu)建學(xué)習(xí)系統(tǒng),需要工程組織尚未具備的能力
這一轉(zhuǎn)型對(duì)軟件工程的影響深遠(yuǎn):
獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì):定義 RL 系統(tǒng)優(yōu)化目標(biāo),是產(chǎn)品思維與 ML 工程交叉的全新難題
數(shù)據(jù)治理與隱私架構(gòu):是聯(lián)邦學(xué)習(xí)的前提,而非事后補(bǔ)救
可觀測(cè)性工具:監(jiān)控自主修改行為的系統(tǒng),與監(jiān)控固定代碼的系統(tǒng)完全不同
組織架構(gòu):以項(xiàng)目為中心的開(kāi)發(fā)模式,往往不適應(yīng)學(xué)習(xí)系統(tǒng)要求的持續(xù)數(shù)據(jù)驅(qū)動(dòng)優(yōu)化循環(huán)
認(rèn)真完成轉(zhuǎn)型的企業(yè),將獲得結(jié)構(gòu)性復(fù)利優(yōu)勢(shì):
生產(chǎn)中的每一次交互都產(chǎn)生數(shù)據(jù),每一份數(shù)據(jù)都優(yōu)化模型,每一次模型優(yōu)化都讓下一輪實(shí)驗(yàn)更有價(jià)值,學(xué)習(xí)速度會(huì)越來(lái)越快。
固守靜態(tài)系統(tǒng)的企業(yè),將面臨不斷擴(kuò)大的能力鴻溝,即便招聘更多工程師、加快發(fā)布速度也無(wú)法彌補(bǔ)。
最后引用唐納拉?梅多斯:
“你無(wú)法從系統(tǒng)內(nèi)部理解一個(gè)系統(tǒng)?!?/p>



評(píng)論