數字孿生:云的極限
數字孿生技術正吸引著芯片行業的廣泛關注,盡管目前尚不清楚誰將擁有或管理這些技術,最佳抽象層級將是多少,以及它們將如何連接。
盡管如此,對數字孿生的投資仍在不斷增加。早期版本已開始推出,芯片行業的各個領域都在進行試驗,一方面探索其應用方式,另一方面避免被新的或現有的競爭對手甩在身后。如果數字孿生能夠兌現其承諾,它將:
將可測試性設計(DFT)、良率設計(DFY)和可制造性設計(DFM)進一步向設計流程左側前移,并向右延伸至制造環節;
建立在晶圓廠中前后向傳遞特定數據的機制;
集成人工智能(或智能體人工智能)中間件,融合來自不同流程的數據;
提供芯片、晶圓、封裝或工藝的更龐大、更詳細的 “黃金鏡像”,從而更容易發現異常并進行調整。
這還只是開始。芯片行業內外眾多企業的長期愿景是:從初始架構到制造零時刻提供硅前洞察,再到制造后從現場反饋至晶圓廠或封裝廠。這需要處理海量數據,進而需要巨大的計算資源和存儲能力。
數字孿生可大可小。它可以代表整輛車、一座城市,也可以代表子系統、芯片,甚至是多種工作負載或條件下的單個工藝過程,所有這些都在芯片或系統進入量產之前完成。
“數字孿生就像一個系統之系統,你可以將各個部分拼接在一起,” 泰瑞達(Teradyne)智能制造產品經理伊萊?羅斯(Eli Roth)表示,“它從原本 largely 孤立的仿真和模擬環境發展而來,如今正從設計到封裝、測試實現全流程的數字孿生拼接。它們就像增強版的 SOLIDWORKS 模型,可融入 NVIDIA Omniverse 三維模型。真正有趣的是小芯片(chiplet)和異構集成,裸片、基板、材料、熱效應以及各種可能導致昂貴失效的微小翹曲之間的耦合越來越緊密。因此,如果你能在投入這些昂貴、緊密耦合的系統之前搞清楚問題所在,那將非常有幫助。”
其他人也表示認同。“這些是顛覆性的理念,” 愛德萬測試(Advantest)云解決方案高級咨詢經理文森特?朱(Vincent Chu)說,“人們談論晶圓廠工藝的數字孿生,但往往只局限于前端工藝。如果將其與后端結合 —— 因為自動測試設備(ATE)擁有器件的黃金標準 —— 那么前端工藝的仿真將更加準確。通過在數字孿生環境中跨環節前向傳遞數據,我們可以開發模型并進行多種假設分析,提高后端測試流程的效率。”
這可能包括多變量篩選以提高吞吐量和質量,這在多芯片組裝中尤為重要。“我們正在制造人工智能芯片,這些芯片通常包含異構集成,” 朱說,“挑戰在于如何在芯片組裝前確保裸片的質量。這些是非常大的封裝,集成了多個甚至數十個裸片。如果沒有篩選出有問題的裸片,就會導致整個封裝報廢。”
盡管制造前的投資更高,但通過提高可靠性和更具領域 / 工作負載針對性的設計,良率提升和退貨授權(RMA)減少所帶來的成本節約可能非常顯著。然而,協調所有環節的整合并非易事。
“當晶圓在晶圓廠進行測試時,他們不知道這些芯片將被送往何處進行封裝、組裝和測試,因此他們需要知道如何發送物料,這是目前尚未實現的,”PDF Solutions 首席執行官約翰?基巴利安(John Kibarian)說,“這就像一種低代碼 / 無代碼的方式連接主要應用系統。你需要產品生命周期管理(PLM)系統、企業資源計劃(ERP)系統、制造執行系統(MES)、工程數據、制造良率數據,最終還有設計自動化信息。你需要獲取這些信息,實現人機分離,讓人工智能做出正確決策,這才是真正的目標。”

數字孿生的用途與益處
當前的數字孿生與未來愿景仍有很大差距。實現這一愿景需要多個步驟,首先是降低制造工藝的變異性,進而從芯片制造零時刻起提升其全生命周期的可靠性。
“測試領域的左移趨勢已經持續多年,如今正達到極致,” 西門子數字工業軟件汽車 IC 解決方案總監李?哈里森(Lee Harrison)說,“成為可測試性設計(DFT)工程師的同時,你也成為了功能架構師。我們使用 PCIe,有控制測試的流程,還有安全區域。因此,DFT 工程師需要完成完整的子系統架構設計,包括功能總線、嵌入式軟件,并了解如何訓練 PCI 和 UCIe。我們內部正在推進的一項工作是讓 DFT 工程師成為功能設計師,因為在處理小芯片等更大規模的設計時,測試基礎設施的控制、監控和整體設置現在通過一種小型功能域完成,而不是由器件外部的隨機引腳控制。”
數字孿生也可用于測試 DFT 基礎設施和結構。“我們首次在設計與驗證會議(DVCon)上看到 DFT 工程師的身影,” 哈里森說,“我們可以在 ATE 上對整個測試基礎設施進行預演,在流片前證明其可行性。”
這大致相當于從谷歌地球的宏觀視角,深入到特定工作負載的熱梯度對 2 納米晶體管的影響。它需要連接許多以往從未結合的部分,并在不同應力下操作這些部分以獲得最優或至少可行的解決方案。這在大型仿真中已經有限實現,但操作各種工藝、替換不同組件(如不同工藝節點的小芯片、不同互連或內存)的能力是全新的。
“我們可以從原子級模擬到系統級模擬,” 新思科技杰出架構師亞當?克龍(Adam Cron)說,“很多數字孿生就是仿真,在不實際構建的情況下進行操作。我們在流片前已經模擬功能模式,這都是數字孿生。如果行不通,要么不構建,要么至少知道自己在構建有問題的東西并了解原因。制造既昂貴又耗時,在啟動制造前進行數字孿生模擬要快得多。”
追求更好的結果
實現數字孿生的全部潛力需要跨行業的大量協調,在某些情況下,還需要行業內多個細分領域的協作。
“我們目前處于點解決方案階段,” 克龍說,“我們已經有了知識助手,基本已經推出。我們進入了生成式階段,腳本也能自動生成。如果你需要特定的輔助材料,我們已經開始在工具中加入相關功能,你可以在屏幕上提問,工具會為你生成并融入你的流程。我們還開始進入智能體階段,能夠識別設計規則檢查(DRC)違規,然后由工具自動修復。很快,智能體之間將實現對話,這在封閉環境中已經實現。”
數字孿生還可用于改進單個制造工藝。“它們可以幫助我們從輸入和輸出的測量數據中獲取更大價值,幫助我們的工具表現更好,”Onto Innovation 企業軟件事業部產品經理肖恩?金(Sean King)說,“通過我們的檢測和計量工具,我們收集更多數據,集中整合,發現不一致之處,在一個中央平臺上整合所有信息,從而了解它們的性能和相互匹配情況。你可以考慮用于預測性維護的數字孿生,確保工具正常運行。在客戶端,我們的工具是他們進行質量測量和理解實際生產物料的孿生模型的輸入。如果他們不信任我們工具的輸出,又如何信任他們的模型?”
這里的重大挑戰包括整合和組織數據,使其能夠有效且高效地用于識別、預防或解決問題。“結果生成時間必須是其中一部分,” 金說,“這取決于你試圖解決的問題、相關價值、是內部使用還是在其他地方的大型昂貴服務器或云中運行。你是否試圖構建過于龐大、過度擬合問題的系統?這可能導致難以識別問題根源。 pinpoint 問題(如漂移發生)并采取最佳行動相對容易。但在多供應商生態系統中會發生什么?如果我們不溝通、不采用相同方式會怎樣?”
解決這些差異將是一項挑戰。“歐洲有一個大型汽車項目叫 CHASSIS(面向軟件定義汽車的小芯片硬件架構),項目的重要部分是構建整個平臺的數字孿生,讓所有為系統提供小芯片的不同供應商都能虛擬接入其小芯片并查看是否可行,” 西門子的哈里森說,“所有測試基礎設施是否連接并正常工作?插入整個系統后,我們能否運行所有 DFT 基礎設施?你最不想看到的是,這一整套小芯片在功能上完美運行,但在 DFT 方面發現問題 —— 連接不正確,只能測試一半。所以你有了很棒的產品,但完全沒用,無法放入汽車,因為只有一半可測試。”
還有連接不同類型數據的問題,這正是人工智能發揮作用的地方。“我們發現人們正在采用智能體方法,”PDF Solutions 全球晶圓廠應用解決方案經理喬恩?霍爾特(Jon Holt)說,“因此,你有遺留系統和孤立系統,每個系統通過可編程邏輯控制器(PLC)或電子設計自動化(EDA)控制器通信,另一個通過 MES 系統。你可能有產品附帶的簡單數據表,加載到系統中就實現了數字化。我們開始將每個系統都視為一個智能體,這樣就無需傳遞 IP 的所有信息,只需從使用點的智能體獲取所需信息。”
霍爾特表示,目標是將所有智能體的數據整合起來,并在智能體工作流中實現自動化。“這是在我們已有的遺留基礎設施基礎上進行構建,然后開始利用生成式人工智能(GenAI)或大語言模型(LLM)帶來的能力,” 他說,“關鍵之一是確保數據管道的安全。無論采用何種形式,你都需要傳感器以支持結果或結論所需的粒度表示物理世界。這可能是每小時對環境采樣一次,也可能是射頻脈沖沉積工具每毫秒采樣一次。”
標準將有所幫助。國際半導體設備與材料協會(SEMI)在過去六年中一直在分享數字孿生信息,舉辦研討會探討其在制造和供應鏈韌性中的作用。自最初概念提出以來,變化在于云中幾乎無限的計算資源可用,以及人工智能用于融合不同數據類型。這使得數字孿生能夠大規模部署,或進行微小但極深的部署,并能夠深入或擴展分析。
“數字孿生可以在多個層級進行模擬,” 愛德萬測試的朱說,“測試單元本身可以有虛擬身份。例如,我們可以有測試儀和測試的虛擬表示。虛擬測試儀可以離線運行測試程序,并在仿真中操作歷史數據日志。如果你改變條件,結果會怎樣?另一個層級是器件本身。例如,我們可以有虛擬硅片,以便在流片前運行初始測試計劃。如果你有測試車間其他測試儀的孿生模型,你可以基于當前自適應測試條件預測良率或吞吐量。因此,你可以構建另一個模型來模擬測試儀集群的運行,并與生產計劃進行比較。流片后,真正的測試開始,但存在對器件進行調優的趨勢。你可以使用 Verilog 模型模擬器件,然后運行測試程序模擬生產情況。數據可以是合成的,基于你對同系列器件的了解,有一些歷史生產數據,但沒有新器件的數據。”
同樣的概念也可用于理解和跟蹤電路老化,這對安全和關鍵任務應用至關重要。如果特定工作負載增加了芯片或部分芯片的利用率,與用于其他工作負載的相同芯片相比,電遷移的發生率可能在更短時間內更高。
“你可能有一個可修正的模型,顯示汽車出現某種退化,” 新思科技的克龍說,“模型會表明你的性能或泄漏在特定水平下降,這是芯片本身知道的模型。然后,通過系統級的結構化壽命監測(SLM)和 DFT 技術,你可以在每次啟動或關閉汽車時,或在現場每微秒驗證該模型,然后預先確定該芯片是否能達到預期壽命,或不如其他芯片耐用。這將數字孿生延伸到現場,使其非常有意義。”
有了良好的數據和定義明確的數字孿生模型,這些預測可以變得更加精確。“如果你能測量,就能預測;如果你能預測,就能預防,”proteanTecs 業務發展高級總監尼爾?塞弗(Nir Sever)說,“長期測量讓你了解退化速率,從而推斷故障時間點。一旦做到這一點,你就可以預測并提前發送警報,因為你不想等到最后一刻。”
通過正確的模型和數據,這可以實時實現。“如果你有 100% 測試覆蓋率的工作負載,并在絕對最大工作負載下對器件進行可靠性測試,假設模型正確,那么完好的器件不應提前失效,” 塞弗說,“但這里有太多假設。實際上,你可以測試模型的準確性,因此應該在測試上投入更多。但你無法避免生命周期監測,以便在錯誤導致問題前檢測到正在發生或出現的錯誤。”
哈里森表示,數字孿生還可用于確定片上監控器是否真正檢測到異常性能退化。“如果我在芯片上添加所有這些監控器,它真的能給我有用的信息嗎?數字孿生可以做的一件事是對試圖檢測的某些效應進行建模。你可以對某些退化形式和過電壓進行建模。在安全方面,我們正在考慮使用數字孿生來模擬可以進行的側信道攻擊。在實際投入流片前嘗試各種方案真的很棒。”
展望未來與回顧
數字孿生的應用可能性幾乎是無限的,這就是為什么近十年來它一直受到行業關注。這種數據融合也有助于解釋為什么去年 PDF Solutions 收購了 secureWise,新思科技收購了 Ansys。企業正在為這一技術的下一階段布局,并投入大量資金實現目標。
變化在于,足夠多的技術組件已經就位 —— 足夠的計算資源、數據管理和挖掘工具以及人工智能 / 機器學習基礎設施 —— 數字孿生終于可以開始以有意義的方式應用。
“想象一下你有一個退貨授權(RMA),” 泰瑞達的羅斯說,“這里有一批不良器件。發生了什么?三個月前它們在生產中經歷了什么。你可以查看所有生產數據、描述它們的測試結果以及流程中實際發生的情況。我的流程非常復雜。我燒錄了什么,沒燒錄什么?我是如何做出這些決定的?處理 RMA 的人不是構建測試的測試工程師,他試圖弄清楚測試中發生了什么。這些測試程序龐大而復雜,可能有 20 或 30 人參與,讓他們了解其中的情況就像解謎。但如果我能獲取該器件、庫存單位(SKU)、所需特征,就可以在虛擬環境中重新運行并調試。這將非常棒。”
在從設計到制造的任何流程中,更快速地篩選數據并以獨特方式應用的能力是一大飛躍。“你希望從晶圓廠制造流程的前端向后端前向傳遞數據,因為如果你想微調前端處理,就需要參考后端性能,” 愛德萬測試的朱說,“這取決于你的模型有多全面。你可以在前端有非常全面的孿生模型,也可以在后端有孿生模型。然后讓數據在所有階段跨前端和后端流動,進行模擬。”
如今,大部分工作仍處于早期階段,仍有許多挑戰需要解決。但改進流程、提升系統可靠性和降低多層次成本的可能性非常真實且顯著。



評論