久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

專欄中心

EEPW首頁 > 專欄 > 無限視覺生成模型NUWA-Infinity讓視覺藝術創作自由延伸

無限視覺生成模型NUWA-Infinity讓視覺藝術創作自由延伸

發布人:MSRAsia 時間:2022-07-24 來源:工程師 發布文章
編者按:此前,微軟亞洲研究院提出了多模態模型 NUWA,它可以基于給定的文本、視覺或多模態輸入生成圖像或視頻,并支持多種視覺藝術作品創建任務,包括文本到圖像或視頻的生成、圖像補全、視頻預測等。近日,微軟亞洲研究院公開發表了新的研究成果:NUWA 的升級版——無限視覺生成模型 NUWA-Infinity,讓視覺藝術創作趨于“無限流”,可生成任意大小的高分辨率圖像或長時間視頻。一起來感受一下 AI 的無限創作力吧!


或許你也曾有過這樣的想法——那些“世界名畫”畫框外的景色是怎樣的?


讓 NUWA-Infinity 帶我們去“一探究竟”!


發現梵高《星空》畫框外更廣闊的風景:


圖片


“窺探”《清明上河圖》5.287米畫卷外百姓們的千姿百態:


圖片《清明上河圖

圖片

NUWA-Infinity 基于《清明上河圖》學習后,重新創作生成畫作(分辨率:38912x2048)的一部分


NUWA-Infinity 還可以將靜態的圖像轉化成超高清視頻,為其帶來“活力”。


圖片原始靜態圖像

圖片

NUWA-Infinity 基于靜態圖像生成的視頻


除此之外,NUWA-Infinity 也可以依據文本生成超高清圖片,為藝術創作帶來更加豐富的想象力。


圖片


是不是意猶未盡,還想探索更多?歡迎大家點擊閱讀原文,前往 NUWA-Infinity 演示頁面,直觀感受 NUWA-Infinity 的無限創作能力。


為什么微軟亞洲研究院會開發 NUWA-Infinity,背后又用到了哪些新技術?


隨著以消費為基礎的注意力經濟逐漸轉為以生產為基礎的創意經濟,越來越多的人已經成為日常創作者,通過利用各種圖片、視頻編輯工具,實現藝術作品的創新或再創作。然而,高質量的視覺藝術創作從來都不是一件容易的事,往往需要專業的技能和設備,并花費大量的時間。與此同時,日常的視覺藝術創作對更高分辨率的圖像或持續時間更長的視頻也有著越來越高的需求。


為此,微軟亞洲亞洲研究院 NUWA 團隊研發出了無限視覺生成模型 NUWA-Infinity。與同樣覆蓋圖像和視頻創作的 NUWA 相比,NUWA-Infinity 在分辨率和可變大小視覺藝術作品生成方面具有更優的性能,并支持五個高分辨率視覺任務的生成,包括無條件圖像生成高分辨率圖、文本生成高分辨率圖像、文本生成高分辨率視頻、圖像生成高分辨率動畫和圖像生成高分辨率圖像。


在 NUWA-Infinity 模型中,研究員們提出了一種全局自回歸嵌套局部自回歸的生成機制,通過全局自回歸建模視覺塊之間的依賴關系和局部自回歸建模視覺詞之間的依賴關系,讓 NUWA-Infinity 能夠生成全局一致且局部細節豐富的高質量圖像和視頻,并提出任意方向控制器(Arbitrary Direction Controller, ADC)來決定合適的生成順序并學習順序感知的位置嵌入。相比其他多模態生成模型,NUWA-Infinity 可以從給定的文本、圖像或視頻生成與之相關的任意形狀、任意大小的超高分別率圖像,以適配不同設備、平臺和場景;更重要的是,NUWA-Infinity 還支持長時間視頻的生成,比如圖像動畫的制作


此外,NUWA-Infinity 模型還引入了附近上下文池(Nearby Context Pool, NCP來緩存已經生成的局部圖像,作為正在生成的當前圖像的上下文,這可以在不犧牲視覺塊間依賴性的前提下,顯著節省計算成本。NUWA-Infinity 極大地彌補了市場上現有技術僅支持生成大小有限的視覺內容以及視覺內容創作計算成本高昂的不足。


下一步,NUWA 團隊將持續推動 NUWA 的演進,并希望研發出能從三個方面為專業和日常藝術創作者賦能的技術:


  • 構思:通過自動快速和多樣化的設計生成能力,降低構思門檻,在構思階段為藝術創作者提供更多信息和靈感。

  • 美學:降低創意門檻,支持普通用戶以適當的美學/設計質量來創作創意作品(NUWA 模型學習了大量高質量/高美學標準的圖片)。

  • 效率:通過將 NUWA 的能力集合到一套智能工具中,來提高創作效率,降低創作工作量。


未來,由 AI 生成的高分辨率視覺內容將會更加符合圖像設計、廣告、動畫、游戲等行業的視覺內容創作需求,為創作者提供源源不斷的創造靈感。歡迎更多的科研人員、開發者與微軟亞洲研究院共同探索AI視覺創作領域的廣闊未來。


NUWA 是在科研層面開展的,對視覺藝術作品自動生成技術的前沿探索,旨在探索為視覺藝術創作者提供更智能的工具,支持他們更好地發揮自己的創意。微軟始終致力于打擊虛假信息,并盡其所能提供最新技術來檢測被人為操縱的內容,幫助人們識別“深度偽造”(deepfake)的信息(欲了解微軟為打擊虛假信息所做的努力,請訪問:https://blogs.microsoft.com/on-the-issues/2020/09/01/disinformation-deepfakes-newsguard-video-authenticator/)。同時,微軟的技術進步都接受微軟負責任的 AI 流程的指導,并遵循公平、包容、可靠性與安全性、透明、隱私與保障、負責的原則。


論文鏈接:

NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis

https://arxiv.org/abs/2207.09814

演示頁面:

https://nuwa-infinity.microsoft.com/


NUWA-Infinity項目頁面:

https://www.microsoft.com/en-us/research/project/nuwa-infinity/


*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。

關鍵詞: AI

相關推薦

邊緣 AI 加速的 Arm? Cortex??M0+ MCU 如何為電子產品注入更強智能

嵌入式系統 2026-03-25

Gartner發布三大AI價值實現路徑

AI狂潮 半導體通膨壓力重重

智能計算 2026-03-23

基于Microchip MCU的AI/ML培訓教程2

視頻 2025-11-12

TI 攜手 NVIDIA 推出面向下一代 AI 數據中心的完整 800 VDC 電源架構

CSR8670CSR8675智能語音Alexa藍牙方案開發

資源下載 2017-12-14

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

視頻 2025-12-19

盡管與亞馬遜達成芯片合作,英偉達股價仍下跌 3%,油價與加息擔憂沖擊 AI 交易

芯片互連初創企業Kandou AI完成2.25億美元融資

尼吉康的事業介紹

視頻 2025-07-25

在工業自動化和智能家用電器設計中實現支持邊緣 AI 的電機控制

賦能AI與新能源時代的高動態MW級負載平臺

AI正在成為美國軍事系統核心

2026-03-24

基于Microchip MCU的AI/ML培訓教程1

視頻 2025-11-12

英偉達 Groq 3:AI 推理時代已至

EEPW2018年6月刊(5G)

資源下載 2018-06-11

基于Microchip MCU的AI/ML培訓教程3

視頻 2025-11-12

電子元件培訓教材

EEPW2018年3月刊(工業物聯網)

更多 培訓課堂
更多 焦點
更多 視頻

技術專區