近日,中國(guó)科學(xué)院合肥物質(zhì)院智能所許桃勝副研究員團(tuán)隊(duì)提出了一種面向高光譜影像分類(lèi)的高效全向狀態(tài)空間模型 OmniMamba,通過(guò)全向掃描機(jī)制與狀態(tài)空間模型融合,實(shí)現(xiàn)高精度、低參數(shù)量和低計(jì)算復(fù)雜度的高光譜地物分類(lèi)。相關(guān)研究成果發(fā)表于信號(hào)處理領(lǐng)域權(quán)威期刊IEEE Journal of Selected Topics in Signal Processing(Impact factor : 13.7)?上。
高光譜影像能夠獲取地物在連續(xù)波段上的精細(xì)光譜信息,在農(nóng)業(yè)遙感、生態(tài)監(jiān)測(cè)和地物識(shí)別等領(lǐng)域具有重要應(yīng)用價(jià)值。然而,高光譜數(shù)據(jù)存在波段維度高、空間與光譜關(guān)系復(fù)雜、標(biāo)注樣本有限等問(wèn)題。傳統(tǒng)方法難以充分挖掘長(zhǎng)程空間依賴(lài),Transformer 類(lèi)方法雖然具備全局建模能力,但計(jì)算復(fù)雜度較高,限制了其在高效遙感解譯中的應(yīng)用。
針對(duì)上述問(wèn)題,研究人員提出了 OmniMamba 模型,能夠以線性計(jì)算復(fù)雜度實(shí)現(xiàn)高光譜圖像二維空間結(jié)構(gòu)到一維序列的全局建模,兼顧模型輕量化與高分類(lèi)精度。該方法設(shè)計(jì)了row/?column/?zigzag/?snake四種全向掃描策略,將二維空間特征轉(zhuǎn)換為具有結(jié)構(gòu)約束的一維序列,并利用狀態(tài)空間模型實(shí)現(xiàn)線性復(fù)雜度的全局依賴(lài)建模。同時(shí),模型通過(guò)單尺度與多尺度特征協(xié)同交替處理,兼顧細(xì)粒度光譜差異和層次化空間上下文信息,從而提升高光譜影像分類(lèi)精度與模型效率。實(shí)驗(yàn)結(jié)果表明,OmniMamba 在多個(gè)公開(kāi)高光譜影像數(shù)據(jù)集上取得了優(yōu)于現(xiàn)有卷積神經(jīng)網(wǎng)絡(luò)和 Transformer -based方法的分類(lèi)性能,平均總體分類(lèi)精度達(dá)到 99.28%。同時(shí),該模型僅包含約 246 K 參數(shù)量,計(jì)算復(fù)雜度約為 0.04 GFLOPs,展現(xiàn)出在高光譜遙感智能解譯、農(nóng)業(yè)地物識(shí)別和輕量化部署中的應(yīng)用潛力。
中國(guó)科學(xué)院合肥物質(zhì)院智能所與安徽農(nóng)業(yè)大學(xué)聯(lián)合培養(yǎng)碩士研究生鄭淇勻?yàn)檎撐牡谝蛔髡撸悄軝C(jī)械研究所許桃勝副研究員為通訊作者。該研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、安徽省重點(diǎn)研發(fā)計(jì)劃、安徽省科技重大專(zhuān)項(xiàng)等項(xiàng)目支持。
文章鏈接:https://ieeexplore.ieee.org/document/11362929

OmniMamba 模型的空間分類(lèi)框架

OmniMamba在WHC高光譜數(shù)據(jù)集上的分類(lèi)結(jié)果