論文賞讀 | TMM | 多源遙感圖像土地分類製圖, Fast and Effective: 漸進層級融合PHFNet網絡


 RS   DL 

論文介紹

題目:Fast and Effective: Progressive Hierarchical Fusion Classification for Remote Sensing Images

期刊:IEEE Transactions on Multimedia

論文:https://ieeexplore.ieee.org/abstract/document/10522846

代碼:https://github.com/ShirlySmile/PHFNet

年份:2024

注: 本篇由論文原作者審覈

創新點

  • 提出了一種用於多源遙感圖像分類的輕量級網絡PHFNet,以其輕量級的設計和優越的性能表現出很強的實用性。具體的,PHFNet 在主流基準測試中的分類性能優於其他最先進的方法,同時在參數大小和推理速度方面也表現出色(見圖 2)。


  • 爲了更好地捕獲跨源互補信息,引入了自適應調製融合模塊(AMF)。該模塊採用風格指導和校準來對齊跨源特徵,減輕域差異,然後產生高質量的多源表示。 


  • 爲了充分利用不同級別特徵的語義和細節信息,提出了一種改進的卷積門控循環單元(iConvGRU)。iConvGRU 精心管理不同級別特徵的特徵保留和遺忘,從而產生上下文增強的全局表示。

數據

  • MUUFL數據集:該數據集包含從南密西西比大學採集的高光譜圖像(HSI)和激光雷達(LiDAR)數據。它包括11個類別,共有53,687個實例。

  • https://github.com/GatorSense/MUUFLGulfport

  • 奧格斯堡數據集(Augsburg dataset):該數據集從德國奧格斯堡採集,包含HSI和合成孔徑雷達(SAR)數據,空間分辨率爲30米,圖像尺寸爲332x485像素。

  • https://www.sciencedirect.com/science/article/pii/S0924271621001362


  • 休斯頓2013數據集(Houston 2013 dataset):該數據集於2012年在休斯頓及其周邊地區採集,包含HSI和LiDAR數據,空間分辨率爲2.5米,圖像尺寸爲349x1905像素。

  • https://ieeexplore.ieee.org/abstract/document/6776408

方法

總體結構

跨源特徵融合:AMF

自適應調製融合(AMF)模塊旨在實現跨源特徵互補融合。不同源特徵之間的領域差異阻礙了有效的信息集成。因此,在融合之前需要對跨源特徵進行對齊。受風格遷移方法的啓發,AMF模塊對特徵進行調製以統一跨源特徵的風格。這種風格對齊增強了多源特徵分佈的一致性,促進了特徵互補融合。AMF的具體操作如圖4所示。

漸進融合模塊:iConvGRU

iConvGRU 旨在整合分層特徵的語義和細節信息。在這項工作中,不同級別的特徵的逐步融合表現出順序性,使得使用循環架構成爲自然的選擇。因此,我們在 ConvGRU 的基礎上引入 iConvGRU,以自適應地管理順序分層特徵中的信息保留和丟棄,在保持模型性能的同時提高計算效率並減少參數數量。

ConvGRU 和 iConvGRU 相比主要有兩個區別:1)從結構上來說,iConvGRU 比 ConvGRU 少一個門,從而參數數量減少一半。ConvGRU 包含兩個門 - 重置和更新,iConvGRU 僅保留關鍵更新門,指示特徵序列內的信息保留和丟棄。2)在更新門中進行融合之前,引入了一個額外的 tanh 運算,應用於先前的隱藏狀態。這確保了兩個分支的特徵範圍一致,從而均勻地影響更新門操作。這種特徵範圍的一致性有助於模型辨別要保留和丟棄哪些信息。

結果和精度

精度對比

精度值對比

可視對比

複雜度和效率分析



歡迎關注CVPR 2024系列


  • 點此進入CVPR2024遙感方向合集


因配置了AI回覆功能,除關鍵詞自動回覆外,號內信息主要由AI大模型回覆。如需資源、投稿、合作等,請直接聯繫小助手微信(添加請備註:諮詢投稿合作加羣,加羣需備註姓名/暱稱,單位和研究方向)。



關於AI回覆功能:


公衆號新增AI回覆功能,已接入大模型,集成查找ArXiv論文、CSDN博文等功能



問題及討論可直接在文章下方留言


相關鏈接:


論文賞讀 | CVPR24 | 利用低分辨率數據更新高分辨率土地覆蓋圖,基於CNN和Transformer的弱監督框架
論文賞讀 | ISPRS | 多模態學習用於多雲條件下的土地覆蓋製圖
論文賞讀 | ISPRS | LoveNAS: 自動搜索最優解碼器,用於土地覆蓋製圖
論文賞讀 | CM-UNet: 結合CNN和Mamba的遙感語義分割網絡
論文賞讀 | IGARSS24 | 基於多模態遙感數據識別大尺度城市區中每棟建築的功能

  歡迎關注  


分享遙感與深度學習領域的技術、論文、書籍、新鮮事。



歡迎加入遙感與深度學習交流羣(點此加入)。