TI 的 TinyEngine NPU 為嵌入式系統解鎖邊緣 AI 加速能力,打破傳統設計限制
要點速覽
邊緣 AI 不僅適用于高端應用。TI 微控制器 (MCU) 集成了 TinyEngine 神經處理單元 (NPU),可在更多電子產品中實現邊緣 AI,從資源受限的器件(包括便攜式、電池供電產品)到復雜的工業應用均可適用。
什么是 TinyEngine NPU?
TinyEngine NPU 是一款專有硬件加速器,集成于 TI C2000? 及基于 Arm? Cortex 的 MCU? 中(圖 1),專為幫助嵌入式系統設計人員在大規模部署邊緣 AI 模型時降低延遲、提升能效而設計。

圖 1 集成 TinyEngine NPU 的 TI 邊緣 AI MCU 簡化框圖
TinyEngine NPU 與主 CPU 并行執行機器學習算法,從而能夠在資源受限的器件上實時處理神經網絡模型。此 NPU 對深度學習推理運算進行優化,降低邊緣端處理的延遲與功耗,消除云端推理的往返延遲,提升系統響應速度。
該 NPU 助力將邊緣 AI 能力拓展至此前無法承載有效 AI 工作負載的器件中。包括電池供電電子設備、具備實時分析能力的醫療可穿戴設備、個人電子及工業設備。
TinyEngine NPU 的主要優勢
TinyEngine NPU 提供以下優勢,突破了傳統上阻礙嵌入式 AI 廣泛應用的關鍵設計限制:
相比基于軟件的 AI 方案,每次推理能耗僅為其 1/120,延遲僅為其 1/90
提供 2.56 GOPS 計算性能,支持深度學習模型實時邊緣 AI 推理
支持 8 位、4 位和 2 位以及混合精度配置,可完成量化和就地計算,以解決存儲器占用空間限制
支持多種神經網絡層類型,如卷積層(常規、深度、逐點、轉置)、全連接層和池化層(平均池化和最大池化),并支持批量歸一化
通過簡化工具鏈降低開發復雜性,將開發時間從數周縮短至數小時
哪些 TI MCU 采用TinyEngine NPU?
TMS320F28P550SJ
TMS320F28P55x 系列 C2000 MCU 中的 NPU 可從主 CPU 中分擔 AI 推理任務。
對于電機驅動應用,該 NPU 支持電機軸承故障檢測,以支持預測性維護,幫助設計人員及早發現機械性能下降,從而減少計劃外停機時間與維修成本。
對于太陽能和儲能應用,NPU 支持電弧故障檢測,用于識別危險的電氣故障,從而提高系統安全性并減少誤報。
在這兩種情況下,NPU 在本地運行卷積神經網絡,其延遲比實施純軟件方案低 5 到 10 倍。
AM13E230x
這類 Arm Cortex-M33 內核的 MCU 通過集成 NPU 和先進的實時控制架構,可在電器、機器人和工業系統中實現自適應控制和預測性維護。
這種高集成度使設計人員無需外部元件,即可同時實現復雜的電機控制和 AI 功能,并為多達四個電機維持精確的實時控制環路。NPU 可運行自適應控制算法,用于負載檢測和能量優化。
點擊下方文章閱讀了解產品詳情
TI AM13E230x MCU 賦能邊緣 AI 電機控制,破解人形機器人執行器和智能家電關鍵難題
MSPM0G5187
這類 80MHz Arm Cortex-M0+ 內核的 MCU 屬于 TI MSPM0 MCU 系列,利用 NPU 在具有成本效益的低功耗電子產品中實現邊緣 AI 功能。
專用硬件 NPU 可獨立于主 CPU 執行深度神經網絡模型,延遲時間比實施軟件方案低 90 倍,在待機模式下消耗低于 2μA。
點擊下方文章閱讀了解產品詳情
邊緣 AI 加速的 Arm? Cortex??M0+ MCU 如何為電子產品注入更強智能
TI 支持邊緣 AI 功能的 MCU 快速入門
設計人員可以使用 TI 免費且免專利費的 CCStudio Edge AI Studio 更快開展邊緣 AI 設計,該工具支持 TI 全系列 MCU 無縫開發,包括通用型、實時控制、無線連接及雷達類 MCU。借助 CCStudio Edge AI Studio,開發人員可通過集成的工作流完成全流程開發,涵蓋數據采集與標注、特征提取、神經網絡模型選型與調優、模型編譯及目標硬件部署。
該平臺提供 60 余個代碼示例、專用應用參考設計(電弧故障檢測、電機故障預測),支持 PyTorch 等行業標準框架,同時提供無代碼設計方案。經過訓練的模型自動轉換為經過優化的軟件庫,無需手動編碼。
TI 的量化工具和神經網絡編譯器還可為使用專有 AI 框架的開發人員實現快速模型移植,顯著縮短開發周期。這些工具還支持多種神經網絡層,兼容 ONNX 等行業標準訓練模型格式。













評論