近日,中國科學院合肥物質院智能所仿生智能技術研究中心黃炫和韋虎課題組與中國科學技術大學、中國礦業大學與清華大學部分課題組合作完成的文章“Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring”被計算機視覺和模式識別領域的頂級會議Conference on Computer Vision and Pattern Recognition(CVPR)接收發表。
單圖像運動模糊去除旨在消除被未知模糊核破壞的退化圖像中的所存在的運動模糊現象,恢復圖像的清晰銳化版本,使得質量退化的模糊圖像恢復其原本的價值。此外,圖像運動模糊的消除也有利于幫助語義分割、目標檢測、目標追蹤等下游應用提高準確率和魯棒性,具有重要的研究價值。由粗到細的方案被廣泛應用于傳統的單圖像運動去模糊中,然而,在深度學習的背景下,現有的多尺度算法不僅需要使用復雜的模塊對低分辨率RGB 域圖像和深度語義進行特征融合,還需要手動生成置信度不足的低分辨率圖像對。
在該項工作中,科研團隊提出了一種基于單輸入多輸出(SIMO)的多尺度運動去模糊網絡,簡化了現有基于由粗到細方案算法的復雜性。同時,為了減輕使用多尺度架構帶來的細節信息修復缺陷,團隊將真實世界的模糊軌跡特征與可學習的小波變換模塊相結合,重點關注從模糊圖像到清晰圖像之間逐步復原的方向連續性和頻率特性。團隊創新了一種具有可學習離散小波變換的多尺度網絡(MLWNet),它在多個真實世界的模糊數據集上,無論在主觀和客觀質量方面,還是計算效率方面,都表現出了最先進的性能。
智能所碩士研究生邱天衡為共同第一作者,黃炫副研究員為共同通訊作者,該項工作得到了國家自然科學基金與國家高技術研究發展計劃的支持。
CVPR 是計算機視覺方向的三大頂級會議之一。根據谷歌學術公布的2022年最新學術期刊和會議影響力排名,CVPR在所有學術刊物中位居第4,僅次于Nature、NEJM和Science。
文章鏈接:https://arxiv.org/abs/2401.00027v2

MLWNet與其他sota模型在RealBlur-J測試集上的對比結果示意圖

MLWNet模型架構圖

MLWNet與其他sota模型在RSBlur測試集上的可視化結果對比圖