Marr是一位跨學科的傳奇人物,他在1970年代將神經科學、心理學的成果與數學方法相結合,提出了視覺計算的理論框架,並釐清了計算理論、算法、實現三個研究層次,對計算機視覺在1980—1990年代的蓬勃發展提供了指導思想。我在1989年作為一名大三學生有幸讀到這本書的第一個中譯本,從而走上了計算機視覺的科研道路。
朱松純 北京通用人工智能研究院院長,北京大學、清華大學講席教授
我看過的第一本計算機視覺英文書就是David Marr的Vision。非常高興看到吳佳俊教授將此書翻譯成中文。Marr提出的用於研究和理解視覺感知的計算框架,以及如何通過神經科學和認知科學問題來達成閉環的思路,深刻影響了幾十年來計算機視覺領域的發展。我也特別喜歡本書第七章自問自答的寫作風格。在深度學習廣泛應用於計算機視覺的今天,再讀1980年出版的Marr的經典著作,同時參考Ullman、Poggio和Grimson 教授為中文版特別撰寫的推薦序和後記,我相信會對人工智能從業者和學生們有非常大的啟發作用。
瀋向洋 粵港澳大灣區數字經濟研究院理事長,美國國家工程院外籍院士
Marr的《視覺》在35年前我開始職業生涯時發揮了極其關鍵的作用。按照Marr提出的框架,視覺表示從圖像到初草圖(邊緣提取)到2.5維草圖(深度圖重建)到三維模型表示。那時邊緣提取已經非常成熟,深度圖重建已經有了長足的發展,但三維模型表示纔起步不久,我義無反顧地投入三維視覺的研究及在移動機器人領域的應用,很幸運參與並為後續近20年三維視覺的蓬勃發展做出了一點貢獻。
Marr的《視覺》成書於40多年前,它不是一本計算機視覺的書,而是關於人類視覺的計算理論。在深度學習時代,有了足夠的數據,端到端的訓練似乎不需要計算理論,但我觀察到在過去的兩三年,一個有趣的現像悄悄發生——無論是視覺、語音,還是自然語言處理,數據紅利慢慢消失,新的突破往往來自在神經網絡結構設計中加入對領域的深入理解,而這,離不開計算理論的指導。強烈推薦Marr的《視覺》一書。
張正友 騰訊17級傑出科學家,AI Lab和Robotics X實驗室主任
很高興看到這本Marr的經典著作的中文版的面世,仿佛又回到了九十年代在MIT讀書時的課堂。經典永流傳,四十年後,在深度學習開啟的人工智能時代,本書仍舊在不斷啟發我們對計算機視覺的研究。
湯曉鷗 香港中文大學教授,工程學院傑出學人,商湯科技創始人
Marr在《視覺》一書中描述的視覺計算理論的思想,在數十年間主導了計算機視覺的發展。四十年後的今天,我們再讀這本書,會發現雖然Marr的具體計算理論可能是理想化的,但他對計算理論這一概念的追求,啟發了我們找到了物體識別這個新的計算目標,構建了ImageNet這樣的數據集,並最終影響了今日計算機視覺的發展。在此,我向大家鄭重推薦我的同事吳佳俊翻譯的《視覺》中文版。
李飛飛 斯坦福大學紅杉講席教授,美國國家工程院、國家醫學院、藝術與科學院院士