近日,我院智能信息處理研究團隊2021級碩士研究生唐松同學在唐榮年教授和李創教授的聯合指導下,在國際頂級會議IEEE/CVF International Conference on Computer Vision(簡稱ICCV)上發表最新研究論文(如圖1所示),題目為“SwinLSTM: Improving Spatiotemporal Prediction Accuracy using Swin Transformer and LSTM”。ICCV 是全球計算機領域頂級的學術會議,每兩年召開一次,享有極高的學術聲譽,本屆會議共有 8068 篇投稿,接收率為26.8%。
圖1 文章首頁
該論文首次提出整合Vision Transformers(ViTs)和LSTMs的方法用于時空建模,且在四個常用的時空預測數據集上達到了最先進的性能,具有以下兩大創新點:
1、 提出了一種新的循環單元SwinLSTM,它能夠有效地提取時空表征。與以往基于卷積神經網絡的方法不同,完全采用自注意力機制建模全局空間信息,減少了局部建模帶來的信息損失。
2、 提出了兩個新的預測網絡SwinLSTM-B和SwinLSTM-D(如圖2所示)用于時空預測任務,它可以有效地建立空間和時間依賴性。
圖2 SwinLSTM模型整體框架圖
文章鍊接:https://arxiv.org/abs/2308.09891
海南大學為該ICCV論文的唯一完成單位,該論文是我院首篇人工智能領域的頂級會議論文。