久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 從構(gòu)建軟件到構(gòu)建學(xué)習(xí)系統(tǒng)

從構(gòu)建軟件到構(gòu)建學(xué)習(xí)系統(tǒng)

作者: 時(shí)間:2026-05-08 來(lái)源: 收藏

認(rèn)真完成這一轉(zhuǎn)型的企業(yè),收獲的將不只是更優(yōu)秀的功能,而是一種可復(fù)利的結(jié)構(gòu)性?xún)?yōu)勢(shì),且會(huì)隨著每一輪部署周期不斷擴(kuò)大。

的大部分歷史里,我們一直遵循一種看似簡(jiǎn)單的模式:工程師定義行為,系統(tǒng)執(zhí)行行為;行為出錯(cuò)時(shí)工程師修復(fù),需求變更時(shí)工程師重寫(xiě)。在版本發(fā)布之間,系統(tǒng)是靜態(tài)的 —— 它不會(huì)從生產(chǎn)環(huán)境的觀測(cè)中學(xué)習(xí),不會(huì)適配用戶(hù)真實(shí)行為,也不會(huì)自主優(yōu)化。

這種模式正在過(guò)時(shí)。不是因?yàn)楣こ處煴蝗〈撬麄兯鶚?gòu)建的系統(tǒng)在本質(zhì)上發(fā)生了改變。新一代軟件系統(tǒng)會(huì)從運(yùn)行產(chǎn)生的數(shù)據(jù)中持續(xù)學(xué)習(xí),通過(guò)強(qiáng)化學(xué)習(xí)與結(jié)構(gòu)化實(shí)驗(yàn)自主優(yōu)化行為,某些場(chǎng)景下甚至能在運(yùn)行時(shí)自動(dòng)生成并部署代碼。

正從轉(zhuǎn)向構(gòu)建。這一變革的重要性,堪比當(dāng)年從瀑布開(kāi)發(fā)轉(zhuǎn)向敏捷開(kāi)發(fā)。這是我在里約熱內(nèi)盧舉辦的2026 國(guó)際大會(huì)(ICSE) 上的核心觀點(diǎn),本文將結(jié)合已落地實(shí)踐的企業(yè),進(jìn)一步展開(kāi)解讀。

關(guān)鍵區(qū)別:用 AI 的系統(tǒng) vs 會(huì)持續(xù)學(xué)習(xí)的系統(tǒng)

我們必須清晰區(qū)分兩類(lèi)系統(tǒng):

  • 大多數(shù)企業(yè)只做到了在產(chǎn)品里嵌入 AI 模型,提升預(yù)測(cè)能力、推出更智能的功能。

  • 極少企業(yè)做到了打造能自動(dòng)閉環(huán) “部署 — 優(yōu)化” 的生產(chǎn)系統(tǒng),無(wú)需工程師手動(dòng)采集數(shù)據(jù)、重新訓(xùn)練、重新發(fā)布。

兩者不是程度差異,而是架構(gòu)差異。

把每一次生產(chǎn)交互當(dāng)作訓(xùn)練信號(hào),每一次發(fā)布當(dāng)作一次實(shí)驗(yàn),每一次失敗當(dāng)作反饋。構(gòu)建它需要全新的設(shè)計(jì)模式、基礎(chǔ)設(shè)施,以及對(duì)軟件工程本質(zhì)的重新理解。

四大技術(shù)融合,讓規(guī)模化成為可能

1. 強(qiáng)化學(xué)習(xí)(RL)

監(jiān)督學(xué)習(xí)需要提前準(zhǔn)備標(biāo)注數(shù)據(jù),而強(qiáng)化學(xué)習(xí)讓系統(tǒng)在實(shí)踐中學(xué)習(xí):執(zhí)行動(dòng)作、觀測(cè)結(jié)果、朝著更優(yōu)方向更新行為。

在內(nèi)容推薦、物流路徑、網(wǎng)絡(luò)優(yōu)化等序列決策場(chǎng)景,這是顛覆性能力升級(jí)。用 RL 優(yōu)化配送路線(xiàn)的系統(tǒng),不需要工程師告訴它最優(yōu)路徑,而是通過(guò)實(shí)測(cè)、評(píng)估、持續(xù)迭代找到最優(yōu)解。

Ray 分布式計(jì)算框架背后的Anyscale,通過(guò) RLlib 讓工業(yè)級(jí)強(qiáng)化學(xué)習(xí)可工程化落地。Grab、愛(ài)立信、摩根大通等都在這套基礎(chǔ)設(shè)施上運(yùn)行實(shí)時(shí)強(qiáng)化學(xué)習(xí)任務(wù),Physical Intelligence 也用它訓(xùn)練機(jī)器人系統(tǒng)。

Anyscale 證明:RL 不再是局限于游戲基準(zhǔn)的科研玩具,而是已在關(guān)鍵業(yè)務(wù)流程中規(guī)?;\(yùn)行的工程能力。

2. 聯(lián)邦學(xué)習(xí)(FL)

它解決了 AI 商業(yè)化以來(lái)的結(jié)構(gòu)性難題:世界上最有價(jià)值的數(shù)據(jù)大多不能移動(dòng)。

  • 醫(yī)療記錄受隱私法規(guī)約束

  • 金融交易受保密協(xié)議限制

  • 工業(yè)設(shè)備傳感器數(shù)據(jù)歸客戶(hù)所有

  • 車(chē)輛遙測(cè)數(shù)據(jù)分散在全球各地

傳統(tǒng) AI 訓(xùn)練需要集中數(shù)據(jù),導(dǎo)致絕大多數(shù)高價(jià)值企業(yè)場(chǎng)景無(wú)法使用。

聯(lián)邦學(xué)習(xí)完全顛覆這一邏輯:不把數(shù)據(jù)搬到模型,而是把模型分發(fā)到數(shù)據(jù)所在端側(cè);本地完成訓(xùn)練,只回傳模型的數(shù)學(xué)更新量,不傳輸原始數(shù)據(jù),再聚合為全局共享模型。

來(lái)自劍橋大學(xué)研究、由 Felicis、Mozilla Ventures、Hugging Face CEO 等投資的Flower Labs,打造了全球最流行的開(kāi)源聯(lián)邦學(xué)習(xí)框架,諾基亞、保時(shí)捷、三星、Brave 均已商用,曾支持1500 萬(wàn)客戶(hù)端同時(shí)實(shí)驗(yàn)。

對(duì)汽車(chē)、醫(yī)療、金融、工業(yè)物聯(lián)網(wǎng)等數(shù)據(jù)分散、敏感、受監(jiān)管的軟件密集型企業(yè),F(xiàn)lower 打開(kāi)了利用此前無(wú)法觸及的數(shù)據(jù)訓(xùn)練 AI 的通道。

其競(jìng)爭(zhēng)意義重大:能用私有分布式數(shù)據(jù)訓(xùn)練的企業(yè),將擁有對(duì)手僅靠公開(kāi) / 集中數(shù)據(jù)無(wú)法匹敵的 AI 系統(tǒng)。

3. 運(yùn)行時(shí)代碼生成與自愈

這是四項(xiàng)技術(shù)中商業(yè)化成熟度最低,但對(duì)軟件工程學(xué)科理論意義最大的一項(xiàng)。

傳統(tǒng)軟件失敗只有兩種:明顯崩潰(可檢測(cè)修復(fù))或靜默退化(難以發(fā)現(xiàn))。

學(xué)習(xí)系統(tǒng)可以做到:遇到從未見(jiàn)過(guò)的運(yùn)行時(shí)故障,動(dòng)態(tài)生成處理邏輯、自動(dòng)部署修復(fù)、無(wú)需人工干預(yù)繼續(xù)運(yùn)行。

多所高校研究團(tuán)隊(duì)已用大模型在原型系統(tǒng)中驗(yàn)證:結(jié)合錯(cuò)誤上下文、程序狀態(tài)、預(yù)期行為,在運(yùn)行時(shí)生成異常處理策略。

商用層面,Cursor、Windsurf 等系統(tǒng)已朝此方向演進(jìn),但仍需開(kāi)發(fā)者輔助,尚未完全自治。

研究與生產(chǎn)落地仍有差距,但方向明確:能自主響應(yīng)故障并修改自身的系統(tǒng),與需要人工恢復(fù)的系統(tǒng)有本質(zhì)區(qū)別。

4. 系統(tǒng)化 A/B 實(shí)驗(yàn)

這是最被低估的技術(shù)。

大多數(shù)企業(yè)只在產(chǎn)品經(jīng)理有假設(shè)時(shí)偶爾做實(shí)驗(yàn);而高速學(xué)習(xí)型企業(yè)把實(shí)驗(yàn)變成持續(xù)化、結(jié)構(gòu)化:

  • 每一次發(fā)布都是實(shí)驗(yàn)

  • 每一次系統(tǒng)決策都是可驗(yàn)證假設(shè)

  • 從觀測(cè)到優(yōu)化的鏈路全自動(dòng)運(yùn)行

這不僅是工具變化,更是軟件系統(tǒng)優(yōu)化理念的升級(jí)。

巴黎創(chuàng)立的Kameleoon是歐洲頂尖實(shí)驗(yàn)平臺(tái),將特性開(kāi)關(guān)、A/B 測(cè)試、多變量實(shí)驗(yàn)、實(shí)時(shí) AI 定向投放整合在一體。其架構(gòu)核心理念:實(shí)驗(yàn)與個(gè)性化不是割裂行為 —— 實(shí)驗(yàn)信號(hào)優(yōu)化下一輪定向,用戶(hù)行為數(shù)據(jù)指導(dǎo)下一輪測(cè)試。

每年運(yùn)行數(shù)千次實(shí)驗(yàn)的企業(yè),學(xué)習(xí)速度與只做幾十次的企業(yè)完全不在一個(gè)量級(jí)。

四大技術(shù)合一:形成可復(fù)利的學(xué)習(xí)架構(gòu)

單獨(dú)看只是工具,組合起來(lái)則構(gòu)成完整學(xué)習(xí)架構(gòu):

  • 強(qiáng)化學(xué)習(xí)需要獎(jiǎng)勵(lì)信號(hào),來(lái)自對(duì)用戶(hù)與系統(tǒng)行為的持續(xù)觀測(cè)

  • 聯(lián)邦學(xué)習(xí)處理分布式數(shù)據(jù),產(chǎn)出的模型可通過(guò) RL 與實(shí)驗(yàn)持續(xù)優(yōu)化

  • 運(yùn)行時(shí)代碼生成讓故障閉環(huán)速度遠(yuǎn)超人工開(kāi)發(fā)周期

  • 系統(tǒng)化 A/B 實(shí)驗(yàn)在全量發(fā)布前用真實(shí)行為驗(yàn)證每一次改動(dòng),形成數(shù)據(jù)飛輪,讓每一輪學(xué)習(xí)迭代質(zhì)量復(fù)利提升

每項(xiàng)技術(shù)都在放大其他技術(shù)的效果,共同定義了:什么是學(xué)習(xí)系統(tǒng),而非靜態(tài)系統(tǒng)。

構(gòu)建學(xué)習(xí)系統(tǒng),需要工程組織尚未具備的能力

這一轉(zhuǎn)型對(duì)軟件工程的影響深遠(yuǎn):

  • 獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì):定義 RL 系統(tǒng)優(yōu)化目標(biāo),是產(chǎn)品思維與 ML 工程交叉的全新難題

  • 數(shù)據(jù)治理與隱私架構(gòu):是聯(lián)邦學(xué)習(xí)的前提,而非事后補(bǔ)救

  • 可觀測(cè)性工具:監(jiān)控自主修改行為的系統(tǒng),與監(jiān)控固定代碼的系統(tǒng)完全不同

  • 組織架構(gòu):以項(xiàng)目為中心的開(kāi)發(fā)模式,往往不適應(yīng)學(xué)習(xí)系統(tǒng)要求的持續(xù)數(shù)據(jù)驅(qū)動(dòng)優(yōu)化循環(huán)

認(rèn)真完成轉(zhuǎn)型的企業(yè),將獲得結(jié)構(gòu)性復(fù)利優(yōu)勢(shì):

生產(chǎn)中的每一次交互都產(chǎn)生數(shù)據(jù),每一份數(shù)據(jù)都優(yōu)化模型,每一次模型優(yōu)化都讓下一輪實(shí)驗(yàn)更有價(jià)值,學(xué)習(xí)速度會(huì)越來(lái)越快。

固守靜態(tài)系統(tǒng)的企業(yè),將面臨不斷擴(kuò)大的能力鴻溝,即便招聘更多工程師、加快發(fā)布速度也無(wú)法彌補(bǔ)。

最后引用唐納拉?梅多斯:

“你無(wú)法從系統(tǒng)內(nèi)部理解一個(gè)系統(tǒng)?!?/p>


評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉