從構(gòu)建軟件到構(gòu)建學(xué)習(xí)系統(tǒng)

作者：時(shí)間：2026-05-08 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

認(rèn)真完成這一轉(zhuǎn)型的企業(yè)，收獲的將不只是更優(yōu)秀的功能，而是一種可復(fù)利的結(jié)構(gòu)性?xún)?yōu)勢(shì)，且會(huì)隨著每一輪部署周期不斷擴(kuò)大。

在軟件工程的大部分歷史里，我們一直遵循一種看似簡(jiǎn)單的模式：工程師定義行為，系統(tǒng)執(zhí)行行為；行為出錯(cuò)時(shí)工程師修復(fù)，需求變更時(shí)工程師重寫(xiě)。在版本發(fā)布之間，系統(tǒng)是靜態(tài)的 —— 它不會(huì)從生產(chǎn)環(huán)境的觀測(cè)中學(xué)習(xí)，不會(huì)適配用戶(hù)真實(shí)行為，也不會(huì)自主優(yōu)化。

這種模式正在過(guò)時(shí)。不是因?yàn)楣こ處煴蝗〈撬麄兯鶚?gòu)建的系統(tǒng)在本質(zhì)上發(fā)生了改變。新一代軟件系統(tǒng)會(huì)從運(yùn)行產(chǎn)生的數(shù)據(jù)中持續(xù)學(xué)習(xí)，通過(guò)強(qiáng)化學(xué)習(xí)與結(jié)構(gòu)化實(shí)驗(yàn)自主優(yōu)化行為，某些場(chǎng)景下甚至能在運(yùn)行時(shí)自動(dòng)生成并部署代碼。

軟件工程正從構(gòu)建軟件轉(zhuǎn)向構(gòu)建學(xué)習(xí)系統(tǒng)。這一變革的重要性，堪比當(dāng)年從瀑布開(kāi)發(fā)轉(zhuǎn)向敏捷開(kāi)發(fā)。這是我在里約熱內(nèi)盧舉辦的2026 國(guó)際軟件工程大會(huì)（ICSE）上的核心觀點(diǎn)，本文將結(jié)合已落地實(shí)踐的企業(yè)，進(jìn)一步展開(kāi)解讀。

關(guān)鍵區(qū)別：用 AI 的系統(tǒng) vs 會(huì)持續(xù)學(xué)習(xí)的系統(tǒng)

我們必須清晰區(qū)分兩類(lèi)系統(tǒng)：

大多數(shù)企業(yè)只做到了在產(chǎn)品里嵌入 AI 模型，提升預(yù)測(cè)能力、推出更智能的功能。
極少企業(yè)做到了打造能自動(dòng)閉環(huán) “部署 — 優(yōu)化” 的生產(chǎn)系統(tǒng)，無(wú)需工程師手動(dòng)采集數(shù)據(jù)、重新訓(xùn)練、重新發(fā)布。

兩者不是程度差異，而是架構(gòu)差異。

學(xué)習(xí)系統(tǒng)把每一次生產(chǎn)交互當(dāng)作訓(xùn)練信號(hào)，每一次發(fā)布當(dāng)作一次實(shí)驗(yàn)，每一次失敗當(dāng)作反饋。構(gòu)建它需要全新的設(shè)計(jì)模式、基礎(chǔ)設(shè)施，以及對(duì)軟件工程本質(zhì)的重新理解。

四大技術(shù)融合，讓規(guī)模化學(xué)習(xí)系統(tǒng)成為可能

1. 強(qiáng)化學(xué)習(xí)（RL）

監(jiān)督學(xué)習(xí)需要提前準(zhǔn)備標(biāo)注數(shù)據(jù)，而強(qiáng)化學(xué)習(xí)讓系統(tǒng)在實(shí)踐中學(xué)習(xí)：執(zhí)行動(dòng)作、觀測(cè)結(jié)果、朝著更優(yōu)方向更新行為。

在內(nèi)容推薦、物流路徑、網(wǎng)絡(luò)優(yōu)化等序列決策場(chǎng)景，這是顛覆性能力升級(jí)。用 RL 優(yōu)化配送路線(xiàn)的系統(tǒng)，不需要工程師告訴它最優(yōu)路徑，而是通過(guò)實(shí)測(cè)、評(píng)估、持續(xù)迭代找到最優(yōu)解。

Ray 分布式計(jì)算框架背后的Anyscale，通過(guò) RLlib 讓工業(yè)級(jí)強(qiáng)化學(xué)習(xí)可工程化落地。Grab、愛(ài)立信、摩根大通等都在這套基礎(chǔ)設(shè)施上運(yùn)行實(shí)時(shí)強(qiáng)化學(xué)習(xí)任務(wù)，Physical Intelligence 也用它訓(xùn)練機(jī)器人系統(tǒng)。

Anyscale 證明：RL 不再是局限于游戲基準(zhǔn)的科研玩具，而是已在關(guān)鍵業(yè)務(wù)流程中規(guī)?；\(yùn)行的工程能力。

2. 聯(lián)邦學(xué)習(xí)（FL）

它解決了 AI 商業(yè)化以來(lái)的結(jié)構(gòu)性難題：世界上最有價(jià)值的數(shù)據(jù)大多不能移動(dòng)。

醫(yī)療記錄受隱私法規(guī)約束
金融交易受保密協(xié)議限制
工業(yè)設(shè)備傳感器數(shù)據(jù)歸客戶(hù)所有
車(chē)輛遙測(cè)數(shù)據(jù)分散在全球各地

傳統(tǒng) AI 訓(xùn)練需要集中數(shù)據(jù)，導(dǎo)致絕大多數(shù)高價(jià)值企業(yè)場(chǎng)景無(wú)法使用。

聯(lián)邦學(xué)習(xí)完全顛覆這一邏輯：不把數(shù)據(jù)搬到模型，而是把模型分發(fā)到數(shù)據(jù)所在端側(cè)；本地完成訓(xùn)練，只回傳模型的數(shù)學(xué)更新量，不傳輸原始數(shù)據(jù)，再聚合為全局共享模型。

來(lái)自劍橋大學(xué)研究、由 Felicis、Mozilla Ventures、Hugging Face CEO 等投資的Flower Labs，打造了全球最流行的開(kāi)源聯(lián)邦學(xué)習(xí)框架，諾基亞、保時(shí)捷、三星、Brave 均已商用，曾支持1500 萬(wàn)客戶(hù)端同時(shí)實(shí)驗(yàn)。

對(duì)汽車(chē)、醫(yī)療、金融、工業(yè)物聯(lián)網(wǎng)等數(shù)據(jù)分散、敏感、受監(jiān)管的軟件密集型企業(yè)，F(xiàn)lower 打開(kāi)了利用此前無(wú)法觸及的數(shù)據(jù)訓(xùn)練 AI 的通道。

其競(jìng)爭(zhēng)意義重大：能用私有分布式數(shù)據(jù)訓(xùn)練的企業(yè)，將擁有對(duì)手僅靠公開(kāi) / 集中數(shù)據(jù)無(wú)法匹敵的 AI 系統(tǒng)。

3. 運(yùn)行時(shí)代碼生成與自愈

這是四項(xiàng)技術(shù)中商業(yè)化成熟度最低，但對(duì)軟件工程學(xué)科理論意義最大的一項(xiàng)。

傳統(tǒng)軟件失敗只有兩種：明顯崩潰（可檢測(cè)修復(fù)）或靜默退化（難以發(fā)現(xiàn)）。

學(xué)習(xí)系統(tǒng)可以做到：遇到從未見(jiàn)過(guò)的運(yùn)行時(shí)故障，動(dòng)態(tài)生成處理邏輯、自動(dòng)部署修復(fù)、無(wú)需人工干預(yù)繼續(xù)運(yùn)行。

多所高校研究團(tuán)隊(duì)已用大模型在原型系統(tǒng)中驗(yàn)證：結(jié)合錯(cuò)誤上下文、程序狀態(tài)、預(yù)期行為，在運(yùn)行時(shí)生成異常處理策略。

商用層面，Cursor、Windsurf 等系統(tǒng)已朝此方向演進(jìn)，但仍需開(kāi)發(fā)者輔助，尚未完全自治。

研究與生產(chǎn)落地仍有差距，但方向明確：能自主響應(yīng)故障并修改自身的系統(tǒng)，與需要人工恢復(fù)的系統(tǒng)有本質(zhì)區(qū)別。

4. 系統(tǒng)化 A/B 實(shí)驗(yàn)

這是最被低估的技術(shù)。

大多數(shù)企業(yè)只在產(chǎn)品經(jīng)理有假設(shè)時(shí)偶爾做實(shí)驗(yàn)；而高速學(xué)習(xí)型企業(yè)把實(shí)驗(yàn)變成持續(xù)化、結(jié)構(gòu)化：

每一次發(fā)布都是實(shí)驗(yàn)
每一次系統(tǒng)決策都是可驗(yàn)證假設(shè)
從觀測(cè)到優(yōu)化的鏈路全自動(dòng)運(yùn)行

這不僅是工具變化，更是軟件系統(tǒng)優(yōu)化理念的升級(jí)。

巴黎創(chuàng)立的Kameleoon是歐洲頂尖實(shí)驗(yàn)平臺(tái)，將特性開(kāi)關(guān)、A/B 測(cè)試、多變量實(shí)驗(yàn)、實(shí)時(shí) AI 定向投放整合在一體。其架構(gòu)核心理念：實(shí)驗(yàn)與個(gè)性化不是割裂行為 —— 實(shí)驗(yàn)信號(hào)優(yōu)化下一輪定向，用戶(hù)行為數(shù)據(jù)指導(dǎo)下一輪測(cè)試。

每年運(yùn)行數(shù)千次實(shí)驗(yàn)的企業(yè)，學(xué)習(xí)速度與只做幾十次的企業(yè)完全不在一個(gè)量級(jí)。

四大技術(shù)合一：形成可復(fù)利的學(xué)習(xí)架構(gòu)

單獨(dú)看只是工具，組合起來(lái)則構(gòu)成完整學(xué)習(xí)架構(gòu)：

強(qiáng)化學(xué)習(xí)需要獎(jiǎng)勵(lì)信號(hào)，來(lái)自對(duì)用戶(hù)與系統(tǒng)行為的持續(xù)觀測(cè)
聯(lián)邦學(xué)習(xí)處理分布式數(shù)據(jù)，產(chǎn)出的模型可通過(guò) RL 與實(shí)驗(yàn)持續(xù)優(yōu)化
運(yùn)行時(shí)代碼生成讓故障閉環(huán)速度遠(yuǎn)超人工開(kāi)發(fā)周期
系統(tǒng)化 A/B 實(shí)驗(yàn)在全量發(fā)布前用真實(shí)行為驗(yàn)證每一次改動(dòng)，形成數(shù)據(jù)飛輪，讓每一輪學(xué)習(xí)迭代質(zhì)量復(fù)利提升

每項(xiàng)技術(shù)都在放大其他技術(shù)的效果，共同定義了：什么是學(xué)習(xí)系統(tǒng)，而非靜態(tài)系統(tǒng)。

構(gòu)建學(xué)習(xí)系統(tǒng)，需要工程組織尚未具備的能力

這一轉(zhuǎn)型對(duì)軟件工程的影響深遠(yuǎn)：

獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)：定義 RL 系統(tǒng)優(yōu)化目標(biāo)，是產(chǎn)品思維與 ML 工程交叉的全新難題
數(shù)據(jù)治理與隱私架構(gòu)：是聯(lián)邦學(xué)習(xí)的前提，而非事后補(bǔ)救
可觀測(cè)性工具：監(jiān)控自主修改行為的系統(tǒng)，與監(jiān)控固定代碼的系統(tǒng)完全不同
組織架構(gòu)：以項(xiàng)目為中心的開(kāi)發(fā)模式，往往不適應(yīng)學(xué)習(xí)系統(tǒng)要求的持續(xù)數(shù)據(jù)驅(qū)動(dòng)優(yōu)化循環(huán)

認(rèn)真完成轉(zhuǎn)型的企業(yè)，將獲得結(jié)構(gòu)性復(fù)利優(yōu)勢(shì)：

生產(chǎn)中的每一次交互都產(chǎn)生數(shù)據(jù)，每一份數(shù)據(jù)都優(yōu)化模型，每一次模型優(yōu)化都讓下一輪實(shí)驗(yàn)更有價(jià)值，學(xué)習(xí)速度會(huì)越來(lái)越快。

固守靜態(tài)系統(tǒng)的企業(yè)，將面臨不斷擴(kuò)大的能力鴻溝，即便招聘更多工程師、加快發(fā)布速度也無(wú)法彌補(bǔ)。

最后引用唐納拉?梅多斯：

“你無(wú)法從系統(tǒng)內(nèi)部理解一個(gè)系統(tǒng)?！?/p>

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

從構(gòu)建軟件到構(gòu)建學(xué)習(xí)系統(tǒng)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)