华为天才少年谢凌曦:关于视觉识别领域发展的个人观点
華為天才少年謝凌曦:關于視覺識別領域發(fā)展的個人觀點
作者 :謝凌曦
編輯:桃子
【新智元導讀】計算機視覺識別領域的發(fā)展如何?華為天才少年謝凌曦分享了萬字長文 ,闡述了個人對其的看法。
最近 ,我參加了幾個高強度的學術活動,包括CCF計算機視覺專委會的閉門研討會和VALSE線下大會。經(jīng)過與其他學者的交流 ,我產生了許多想法,千頭萬緒,便希望把它們整理下來,供自己和同行們參考 。當然,受限于個人的水平和研究范圍,文章中一定會存在許多不準確甚至錯誤的地方 ,當然也不可能覆蓋所有重要的研究方向。我期待與有興趣的學者們進行交流,以充實這些觀點 ,更好地探討未來發(fā)展方向。
在這篇文章中,我將會著重分析計算機視覺領域,特別是視覺感知(即識別)方向所面臨的困難和潛在的研究方向。
相較于針對具體算法的細節(jié)改進 ,我更希望探討當前算法(尤其是基于深度學習的預訓練+微調范式)的局限性和瓶頸 ,并且由此得出初步的發(fā)展性結論,包括哪些問題是重要的、哪些問題是不重要的 、哪些方向值得推進 、哪些方向的性價比較低等。
在開始之前,我先畫出如下思維導圖 。為了尋找合適的切入點,我將從計算機視覺和自然語言處理(人工智能中兩個最受關注的研究方向)的區(qū)別開始談起,引出圖像信號的三個根本性質 :信息稀疏性、域間差異性 、無限粒度性 ,并將它們與幾個重要的研究方向相對應。這樣 ,我們就能更好地了解每個研究方向所處的狀態(tài)