"); //-->
來源:DeepHub IMBA
1. Deformable CNN and Imbalance-Aware Feature Learning for Singing Technique Classification
Yuya Yamamoto, Juhan Nam, Hiroko Terasawahttps://arxiv.org/pdf/2206.12230
歌唱技術是利用音色、音高和聲音的其他成分的時間波動來進行富有表現力的聲樂表演。它們的分類是一項具有挑戰性的任務,這主要是因為兩個因素:
為了解決這些問題,論文開發了一種新的基于變形卷積的音頻特征學習方法,利用類加權損失函數對特征提取器和分類器進行解耦訓練。實驗結果表明:1)可變形卷積提高了分類效果,特別是應用于最后兩層卷積時;2)對分類器進行再訓練,并通過平滑的反頻率加權交叉熵損失函數,提高了分類性能。
Nikita Vladimirov, Ekaterina Brui, Anatoliy Levchuk, Vladimir Fokin, Aleksandr Efimtcev, David Bendahanhttps://arxiv.org/pdf/2206.11127
軟骨缺失的檢測對骨關節炎和類風濕關節炎的診斷至關重要。到目前為止已有大量關于關節磁共振圖像軟骨評估的自動分割工具的論文。與膝關節或髖關節相比,腕關節軟骨的結構更為復雜,針對大關節開發的自動工具無法用于腕關節軟骨的分割。但是全自動腕關節軟骨分割方法具有很高的臨床價值,所以論文通過優化U-Net架構的深度和增加注意層(U-Net_AL),評估了U-Net架構的四種優變體的性能。并·將相應的結果與之前設計的基于patch的卷積神經網絡(CNN)的結果進行比較。分割質量的評估基于使用幾種形態學(2D DSC、3D DSC、精度)和體積指標與手動分割進行的比較分析。
這四種網絡在分割的同質性和質量上都優于基于patch的CNN。U-Net_AL計算的三維DSC中值(0.817)顯著大于其他網絡計算的相應三維DSC值。此外U-Net_AL CNN提供了最小的平均體積誤差(17%)和相對于真實值最高的Pearson相關系數(0.765)。使用U-Net_AL計算的再現性比手動分割的再現性更大。帶有附加注意力層的U-net卷積神經網絡提供了最佳的手腕軟骨分割性能。為了在臨床條件下使用,經過訓練的網絡可以對代表一組特定患者的數據集進行微調。
Muhammad Maaz, Abdelrahman Shaker, Hisham Cholakkal, Salman Khan, Syed Waqas Zamir, Rao Muhammad Anwer, Fahad Shahbaz Khanhttps://arxiv.org/pdf/2206.10589
為了追求精度的不斷提高,通常需要開發大型和復雜的神經網絡。這種模型需要很高的計算資源,因此不能部署在邊緣設備上。所以構建資源高效的通用網絡在多個應用領域都受到到了很大的關注。這篇論文的工作有效地結合了CNN和Transformer模型的優勢,并提出了一種新的高效混合架構EdgeNeXt。
特別是在EdgeNeXt中,引入了分割深度轉置注意力(SDTA)編碼器,該編碼器將輸入分割為多個信道組,并利用深度卷積和跨信道維度的自注意力來隱式增加接收場并編碼多尺度特征。通過在分類、檢測和分割任務上的大量實驗,證明了提出的方法的優點:相對較低的計算要求并優于最先進的方法。以 2.2% 的絕對增益和 28% 的 FLOP 減少的絕對增益超過了 MobileViT。EdgeNeXt模型具有5.6M參數,在ImageNet-1K上實現了79.4% top-1精度。
Yukang Chen, Jianhui Liu, Xiaojuan Qi, Xiangyu Zhang, Jian Sun, Jiaya Jiahttps://arxiv.org/abs/2206.10555
2D CNN 和 ViT 的最新進展表明,大內核對于足夠的感受野和高性能至關重要。受這些論文的啟發,該論文研究了 3D 大內核設計的可行性和挑戰。證明了在 3D CNN 中應用大卷積核在性能和效率上有更多的困難。在 2D CNN 中運行良好的現有技術在 3D 網絡中是無效的,包括流行的 depth-wise convolutions。為了克服這些問題,論文提出了空間組卷積及其大內核模塊(SW-LK 塊)。避免了傳統的 3D 大內核的優化和效率問題。論文提出的大內核 3D CNN 網絡,即 LargeKernel3D,對各種 3D 任務(包括語義分割和對象檢測)產生了重大改進。它在ScanNetv2語義分割上實現了73.9%的mIoU,在NDS nuScenes對象檢測基準上實現了72.8%,在nuScenes LIDAR排行榜上排名第一。通過簡單的多模態融合,NDS 進一步提升至 74.2%。LargeKernel3D 獲得了與其 CNN 和 Transformer 相當或更好的結果。并首次證明大內核對于 3D 網絡是可行且必不可少的。
Rohit Choudhary, Mansi Sharma, Uma T V, Rithvik Anilhttps://arxiv.org/pdf/2206.10375
顯示技術中的HDR捕獲、處理和顯示解決方案是至關重要的。在開發高性價比的3D HDR視頻內容中,多曝光立體圖像序列的深度估計是一項必不可少的任務。這篇論文提出并開發了一種新的深度架構用于多重曝光立體聲深度估計。提出的體系結構有兩個新的組件。
作者:monodeep
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
相關推薦
芯片互連初創企業Kandou AI完成2.25億美元融資
TI 攜手 NVIDIA 推出面向下一代 AI 數據中心的完整 800 VDC 電源架構
WTC-AI型太陽能熱水器電路圖
萬家樂JSYZ5-AI燃氣熱水器電路圖
釋說芯語16:硬科技:構建企業未來之路(附PPT)
在工業自動化和智能家用電器設計中實現支持邊緣 AI 的電機控制
人工智能是如何幫助阻止造假者的?
英偉達 Groq 3:AI 推理時代已至
EEPW2018年6月刊(5G)
盡管與亞馬遜達成芯片合作,英偉達股價仍下跌 3%,油價與加息擔憂沖擊 AI 交易
基于Ai-WB2-12F與Rd-04的雷達檢測系統
瑞薩電子AI單元解決方案成功提高GE醫療(日本)日野工廠的生產力
賦能AI與新能源時代的高動態MW級負載平臺
基于Microchip MCU的AI/ML培訓教程2
CSR8670CSR8675智能語音Alexa藍牙方案開發
WTC-AI太陽能熱水器電路圖
基于Microchip MCU的AI/ML培訓教程3
電子元件培訓教材
AI狂潮 半導體通膨壓力重重
尼吉康的事業介紹
繼上次海聯達Ai-ap100拆機之電源改造
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
AI正在成為美國軍事系統核心
EEPW2018年3月刊(工業物聯網)
基于VisitionX制造智能眼鏡
iCAN-4017 AI功能模塊
海聯達(Aigale)Ai-HD1 無線全高清套件拆解
Gartner發布三大AI價值實現路徑
邊緣 AI 加速的 Arm? Cortex??M0+ MCU 如何為電子產品注入更強智能
基于Microchip MCU的AI/ML培訓教程1