大模型機器視覺新突破,SAM進化版SAV來了:分割一切視頻!開源!
2023/7/19 9:47:06
今年4月,Meta的AI模型Segment Anything Model(SAM,分割一切模型)發布,一鍵輕松實現圖像分割,難怪網友直呼太強。
SAM模型之所以在計算機視覺領域產生重要影響,是因為圖像分割是許多任務中的基礎步驟,比如自動駕駛、人臉識別、車牌識別等都有用到。
在這些應用過程中,從目標檢測、分割再到識別的整個流程,由算法自動完成,無需人工干預,而SAM模型正是專攻其中的圖像分割。
雖然SAM是圖像分割的代表性模型,但不可避免存在以下短板:
1.它能夠處理圖片分割,但是不能處理視頻,尤其是不能對視頻里邊移動的物體做連續追蹤。
2.它能分割,但是并不認識所分割的區域到底是什么。
3.它存在過度分割的問題,經常把一個完整的物體分割成不同的部分,而人是把目標作為整體看待的。
一、SAV模型
現在,云創數據(835305.BJ)在SAM和YOLOv8的基礎上,“分割一切”模型的進化版——分割一切視頻Segment-Any-Video(SAV)來了,進一步豐富了計算機視覺成果。
圖片SAV模型(圖片來源:SAV)
作為一種新的圖像、視頻分割方法,SAV可以在圖片或視頻中實現全自動標注,一鍵分割物體。
同時,基于Zero-Shot Transfer(零樣本遷移),SAV無需額外訓練,即使是訓練庫中沒有的圖片,也可以實現輕松分割。
與SAM相比,SAV升級主要表現在以下方面:
1.既可以分割圖片,也可以分割視頻;
2.可以明確目標對象并打標簽;
3.可得到語義上完整的目標區域。
圖片SAV與SAM圖像分割對比結果(圖片來源:SAV)
從上圖可以看出,SAV將巴士、小汽車等分割成一個個完整的區域,而SAM是把這些單個的物體又分割為不同的區域。
除了圖片以外,通過SAV,視頻也可以進行清晰的目標分割和追蹤。
二、示例
現在,我們在網頁版 demo (http://sav.cstor.cn)上體驗一下SAV,可以直觀地感受SAM和SAV兩者的差異。
在首頁可任意選擇一張示例圖片,也可從本地上傳圖片,然后點擊Segment按鈕,就可以同時得到SAM和SAV的結果。
demo首頁示例圖片(圖片來源:SAV)
圖片分割結果:左側為SAM,右側為SAV(圖片來源:SAV)
如果需要觀察某個實例的詳細效果,鼠標放置原圖,移動鼠標即可。
圖片移動鼠標查看詳細分割效果(圖片來源:SAV)
在上圖中,由SAV分割的兩只小狗是完整而獨立的色塊,并不像左邊分割結果所展示——小狗耳朵顏色和身體部分顏色不一,不是完整的目標對象。同時,SAV分割的兩只小狗都打上了“dog”的標簽。
需要說明的是,本項目只關注算法自動分割的應用場景,所以SAV無需人工輸入點、曲線、矩形框等提示信息。
更多示例如下:
圖片圖片分割結果對比(圖片來源:SAV)
三、原理
如前所述, SAM的自動分割不返回標簽信息,并且一個實例(例如,一輛車)可能會被拆分成多個小區域。
自動分割模式下,SAM不返回標簽信息,車輛被分割成多個區域(圖片來源:SAM)
基于此,研發團隊在SAM的基礎上加入YOLOv8檢測模型,YOLOv8返回的結果中包含目標框、類別及置信度,目標框可作為提示信息輸入到SAM,類別名稱即為標簽,因此SAM加YOLOv8可有效地解決上述問題。
該方法同樣可用于視頻分割任務,與處理單幅圖像不同的是,除了分割,我們通常更關心目標的運動軌跡、目標重識別,以及如何實現一鍵摳視頻等。因此研發團隊在SAM和YOLOv8的基礎上加入跟蹤算法,持續關注感興趣的目標,這樣比單純地分割每幀圖像更有實際意義。
考慮到使用
下一頁
返回列表
返回首頁
©2025 云計算世界-云計算資料和交流中心 電腦版
Powered by iwms
主站蜘蛛池模板:
澎湖县|
津市市|
色达县|
广安市|
大邑县|
竹北市|
葵青区|
旬阳县|
安义县|
天峻县|
台前县|
民丰县|
合川市|
盐山县|
普格县|
定边县|
海原县|
红河县|
正定县|
信丰县|
大渡口区|
碌曲县|
城步|
拜泉县|
黑龙江省|
青州市|
洞头县|
龙泉市|
武川县|
忻州市|
泾源县|
邹平县|
五大连池市|
祁连县|
登封市|
长阳|
玉环县|
常宁市|
石家庄市|
永昌县|
东乡县|