人工智能科學家李飛飛的逆襲之路
這個自從來到美國以后,就飽受經(jīng)濟壓力的乖乖女,卻少見地叛逆了一回。她決定去西藏研究一年藏藥,之后去加州理工學院攻讀PhD。
本文引用地址:http://2s4d.com/article/201701/343232.htm
當我們今天縱觀李飛飛的人生時,會發(fā)現(xiàn),這種追隨內(nèi)心的熱情和強硬堅韌的作風,始終貫穿著她的行為軌跡。正如博士畢業(yè)后,她選擇了當時還不太流行的圖像識別作為研究方向一樣。
圖像識別技術(shù),是人工智能發(fā)展道路上的一座高峰。簡單來說,它就是要教會計算機看圖說話。要知道,“看到”和“懂得”是不一樣的。比如,你可以告訴計算機,“貓”就是有著圓臉、胖身子、 兩個尖尖的耳朵,還有一條長尾巴的東西。
可是,如果圖片是這樣的呢?
一個3歲小孩都能從圖片中識別出“貓”,可是計算機卻做不到。
李飛飛研究了很長時間,始終沒有突破。交好的教授都勸她換個方向,以便拿到tenure(終生教職:在西方高校,有了tenure就相當于終生的職業(yè)生涯都有了保障)。
她當然沒有同意。有一天,李飛飛突然意識到,由于人眼每200毫秒就能獲取一幅圖像,一個3歲兒童可能已經(jīng)獲得了上億次的圖像識別訓練,是計算機的幾何級倍數(shù)。
也就是,關(guān)鍵在于自主訓練量。
李飛飛馬上開始著手,從twitter上抓取海量照片,將它們統(tǒng)統(tǒng)打上標簽后,訓練計算機進行機器學習。機器學習(machine learning),就是給出一定算法,讓計算機自己學習。
這個過程是艱苦的。如今,機器學習已經(jīng)是熱門概念,可在2007年,李飛飛的實驗室缺少人手,又申請不到經(jīng)費。最困難的時候,她一度想重開洗衣店,籌集實驗資金。
她從亞馬遜的眾包平臺中找到了解決辦法,讓全世界的網(wǎng)友一起給圖片打標簽。當時,李飛飛的研究項目,一度是該眾包平臺全球最大的雇主。
一個前所未有的龐大數(shù)據(jù)庫建成了,這就是大名鼎鼎的ImageNet。李飛飛沒有敝帚自珍,而是將ImageNet數(shù)據(jù)庫開源,供學術(shù)和商業(yè)界的每一個實驗室調(diào)取。圖片識別技術(shù)從此飛速發(fā)展,如今已經(jīng)能辨識出大部分照片中的物體,還能用高度擬合的人類語言,將它們描述出來。
由于學術(shù)成就卓著,李飛飛收到了很多社會活動的邀請。她曾經(jīng)接受過 New York Times的訪談,也曾登上 TED的舞臺,講述圖形識別技術(shù)發(fā)展的背后故事。
評論