2022年11月 26日,由中國自動化學會主辦,中國自動化學會模式識別與機器智能(CAA-PRMI)專業(yè)委員會和《模式識別與人工智能》編輯部聯(lián)合組織的2022中國自動化大會專題論壇“模式識別與計算機視覺前沿”成功舉辦。本次論壇邀請了北京大學教授查紅彬、南京理工大學教授楊健、天津大學教授胡清華、清華大學副教授魯繼文、中國科學院沈陽自動化研究所研究員叢楊以及中國科學院自動化研究所研究員赫然六位專家學者作特邀報告。中國自動化學會理事、CAA-PRMI專業(yè)委員會主任、中國科學院自動化研究所研究員劉成林擔任本次論壇主席并致辭,CAA-PRMI專業(yè)委員會主任研究員劉成林與CAA-PRMI專業(yè)委員會秘書長樊彬共同主持了論壇。會議采用線上直播的形式舉辦,吸引了超過6 500人次觀看。
首先,論壇主席劉成林研究員進行了開幕致辭,他介紹了組織本次論壇的初衷,接著,對六位報告嘉賓表示熱烈的歡迎和衷心的感謝,希望借此機會能夠和各位專家及同行加強學術(shù)交流與合作,拓展師生科研視野,促進學科進步發(fā)展,之后簡要介紹了模式識別的發(fā)展歷史和CAA-PRMI專業(yè)委員會。
各位報告嘉賓在開幕合影后,依次進行了精彩的報告。
北京大學教授查紅彬報告的題目是“動態(tài)視覺與SLAM:在線學習的方法”。查教授首先介紹了什么是動態(tài)視覺和SLAM,并以移動傳感器的變化為切入點,闡述了動態(tài)視覺中SLAM要解決的問題,用現(xiàn)有監(jiān)督學習的缺點引出了在線學習方法。為了提高動態(tài)視覺系統(tǒng)在真實復雜場景中的應用能力,視覺系統(tǒng)需要有很強的泛化能力,而在線學習可以很好地解決系統(tǒng)學習過程中的災難性遺忘問題。查教授進一步簡要介紹了其團隊基于在線學習開展的一系列研究,如基于流數(shù)據(jù)的動力學模型構(gòu)建、具有在線自適應能力的自監(jiān)督SLAM學習等。
南京理工大學教授楊健的報告題目是“單目深度估計與深度復原”。楊教授首先介紹了他們團隊針對單目深度估計任務提出的漸進困難挖掘網(wǎng)絡等方法,之后介紹了他們在單目深度復原上開展的工作,包括基于解耦尺度一致學習框架和多模態(tài)掩碼預訓練的深度圖補全方法,以及真實環(huán)境下基于結(jié)構(gòu)流引導網(wǎng)絡的深度超分辨分析方法。
天津大學教授胡清華的報告題目是“低質(zhì)多模態(tài)數(shù)據(jù)動態(tài)可信融合”。胡教授首先介紹了多模態(tài)信息融合問題以及發(fā)展現(xiàn)狀,并分析了現(xiàn)有方法存在的問題,之后介紹了他們團隊提出的典型解決方法,包括利用退化神經(jīng)網(wǎng)絡和三元對抗學習來應對模態(tài)缺失問題的方法,以及基于非負神經(jīng)網(wǎng)絡的證據(jù)估計、基于狄利克雷分布的意見生成、基于約減證據(jù)理論的多源融合等方法對決策的不確定性進行建模以實現(xiàn)可信融合,最后介紹了聯(lián)合約減噪聲屬性和標記的模型處理高噪聲問題。
清華大學副教授魯繼文報告的題目是“視覺基礎模型及應用”。魯教授首先介紹了視覺基礎模型的研究背景與意義。其次,圍繞圖像基礎模型、點云基礎模型和多模態(tài)基礎模型三個方面介紹了他們團隊近年所做的相關工作,包括針對圖像感知提出的高階交互網(wǎng)絡HorNet、動態(tài)稀疏化視覺Transformer模型、全局濾波網(wǎng)絡GFNet等模型,針對點云分析提出的Point-BERT、PointTr、SFCNN等以及OrdianICLIP、P2P等多模態(tài)基礎模型。最后,魯教授對視覺基礎模型的未來進行了展望,表示模型架構(gòu)和通用模型將是未來兩個重要研究方向。
中國科學院沈陽自動化研究所機器人學國家重點實驗室研究員叢楊報告的題目是“深海精細化感知技術(shù)及展望”。叢老師首先介紹了深海探測的意義、水下精細化感知技術(shù)涉及的信息獲取和信息處理關鍵問題。其次,他展示了團隊研發(fā)的基于物理機制的深海高清成像技術(shù)、中國首套深海精細化3D感知系統(tǒng)、大型水下人造設施自主巡檢技術(shù)等深海精細化感知技術(shù)。最后,他針對水下感知技術(shù)應用的不同對象,進一步介紹了技術(shù)未來的研究方向。
中國科學院自動化研究所模式識別國家重點實驗室研究員赫然報告的題目是“視覺內(nèi)容生成與鑒別”。赫老師介紹了深度合成、深度偽造和對抗樣本的概念和聯(lián)系,表示深度合成可分為無中生有、身份替換和人臉重演等方面,并介紹了其團隊在視覺內(nèi)容生成與鑒別的近期進展,包括基礎表示和生成模型、表觀最優(yōu)傳輸生成模型和信息瓶頸解耦生成模型,以及語音驅(qū)動說話人、人臉表情驅(qū)動和人物換臉等內(nèi)容生成方法,同時也介紹了生成虛擬視覺內(nèi)容的鑒別方法,最后簡要討論了該領域的未來發(fā)展方向及趨勢。
本次論壇的圓滿召開有利于推動國內(nèi)模式識別與計算機視覺的研究,邀請的6位權(quán)威專家與參會人員對模式識別與計算機視覺領域的學術(shù)前沿和發(fā)展趨勢進行深入交流和探討,對推動該領域相關研究的發(fā)展和促進產(chǎn)業(yè)應用起到了積極作用。