當前位置:首頁 > 科技文檔 > 計算機軟件及計算機應用 > 正文

視覺Transformer(ViT)發(fā)展綜述

計算機科學 頁數(shù): 16 2024-10-12
摘要: 視覺Transformer(Vision Transformer, ViT)是基于編碼器-解碼器結構的Transformer改進模型,已經被成功應用于計算機視覺領域。近幾年基于ViT的研究層出不窮且效果顯著,基于該模型的工作已經成為計算機視覺任務的重要研究方向,因此針對近年來ViT的發(fā)展進行概述。首先,簡要回顧了ViT的基本原理及遷移過程,并分析了ViT模型的結構特點和優(yōu)勢;然... (共16頁)

開通會員,享受整站包年服務