"); //-->
近日,亞?遜、??智能初創公司 SenseTime 與?港中??學的研究?員,共同開發出了?個利? Web 數據的新框架——OmniSource,該框架在視頻識別領域創造了新記錄。
通過解決圖像、短視頻和?時間未剪輯視頻等數據格式之間的不兼容,并采?數據平衡等方法,OmniSource 能夠?最先進的模型更準確地對視頻進?分類,但其使?的數據卻少了 100 倍。
OmniSource 工作原理
研究?員指出,通常收集訓練視頻分類算法所需的數據既昂貴?費時,因為視頻通常包含?個或多個主題的多個鏡頭,因此分類時必須完整觀看它們,然后?動將其剪切成?段,再仔細添加標注。

OmniSource 的體系結構圖
而 OmniSource 是以集成的?式利用各種來源(搜索引擎,社交媒體)的各種形式 Web 數據,例如:圖像、剪輯視頻和未剪輯視頻。然后,AI 系統過濾掉低質量的數據樣本,并對那些通過其集合的數據樣本(平均為 70% 至 80%)進行標記,對每個樣本進行轉換以使其適?于?標任務,同時提高分類模型訓練的魯棒性。
在給定識別任務后,OmniSource 會獲取所有分類中每個類名的關鍵字,并從上述來源中抓取 Web 數據,并?動刪除重復數據。而對于靜態圖像,要預先準備這些圖像,用于聯合訓練期間使?,它會通過利?移動攝像機使它們?成「偽」視頻。
在聯合訓練階段,?旦將數據過濾并轉換為與?標數據集相同的格式,OmniSource 就會權衡 Web 和?標語料庫,然后采?跨數據集混合方法,將其中包含的示例對及其標簽?于訓練。
更少的數據,更高的精度
在聯合訓練這個階段,據研究?員報告稱,當用 OmniSource 從頭訓練視頻識別模型時,盡管微調效果不佳,但交叉數據混合所取得的效果很好。
而在測試中,團隊使?了三個?標數據集:
· Kinematics-400,其中包含 400 個分類,每個分類包含 400 個 10 分鐘的視頻;
· YouTube-car,其中包含數千個視頻,展示了 196 種不同類型的汽?;
· UCF101,包含 100 個剪輯片段和 101 個類別的視頻識別數據集;

Web 數據集分布。(a)-(c) 顯示了三個 Web 數據集在過濾前后,各個類別數據分布中被可視化。(d)給出了 GG-K400 過濾出的圖像(青色框)和剩余圖像(藍色框)的樣本。雖然成功過濾出了很多不合適的數據,但這使得各類別的數據分布更加不均
關于網站資源,研究人員從 Google 圖像搜索中收集了 200 萬張圖像,從 Instagram 收集了 150 萬圖像和 500,000 個視頻,以及從 YouTube 收集了 17,000 多個視頻。結合?標數據集,所有這些都被輸?到一些視頻分類模型中。
據報告顯示,在沒有進行訓練時,只有 350 萬張圖像和 80 萬分鐘的視頻可以從互聯?上爬取而得,結果不及先前工作的 2%。而在 Kinetics-400 數據集上,經過訓練的模型則顯示出?少 3.0%的準確性提,精度?達 83.6%。同時,該框架下從零開始訓練的最佳模型在 Kinetics-400 數據集上,達到了 80.4%的準確度。
可擴展的視頻識別技術
OmniSource 論?的作者表示,與最先進的技術相比,該框架可以通過更簡單(也更輕巧)的主?設計以及更?的輸?量來實現可持平甚至更好的性能。OmniSource 利?了特定于任務的數據集,并且數據效率更?,與以前的?法相?,它??減少了所需的數據量。此外,框架可推?到各種視頻任務中,例如:視頻識別和細粒度分類等。

圖?來源:Reuters / Thomas Peter
未來,OmniSource 或許還可以應?于私?和公共場所的安全攝像機中。或者,它可以為諸如 Facebook 之類的社交網站,提供視頻審核算法所需的設計信息與技術。
原文地址:
https://venturebeat.com/2020/04/02/amazon-sensetime-omnisource-framework-web-data-video-recognition/
OmniSource 論文地址:
https://arxiv.org/pdf/2003.13042.pdf
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
相關推薦
AMD宣布推出第二代Versal Premium系列,實現全新系統加速水平,滿足數據密集型工作負載需求
交換友情鏈接
MAX457構成的雙路視頻放大電路
[求助]S3C44B0X在矢量中斷確實存在問題,請問大俠是如何解決的呢?
TDA8358J的測試電路
TE Connectivity攜全系列解決方案亮相2024中國航展
MIPS架構的發展和嵌入式應用
教你怎樣改善輸出濾波
未來之“光”:艾邁斯歐司朗引領汽車照明革新
設計通用的Ultra2 SCSI PCB
MathWorks和NXP合作推出用于電池管理系統的Model-Based Design Toolbox
物聯網助力電動車充電設施走向未來
視頻 增強電路
西門子推出Tessent In-System Test,在硅片全生命周期內實現先進的確定性測試
未來在你手中 - ARM,數字世界架構提供商
請教使用遠峰44b0開發板的高手
歐洲設備安裝總線(eib)概述
Plus與傳拓集團攜手推出L4級自動駕駛卡車軟件
兆易創新推出GD32G5系列Cortex-M33內核高性能MCU
基于ARM Cortex-M4的Kinetis 微控制器超低功耗,混合信號集成,最具擴展性的產品系列
嵌入式系統與物聯網
不止射頻:Qorvo解鎖下一代移動設備的無限未來
內容可尋址存儲器CAM在交換機中的應用
在歐洲、美國和中國,新法規的出臺正不斷推動更綠色交通方式的發展
閃速存儲器硬件接口和程序設計中的關鍵技術
初學者求助
電視信號轉換放大電路
面向對象的方法在機械故障診斷系統中的應用
這里有沒有蘇州的朋友,做ARM的,想聯絡一下
TDA8358J的應用電路