一文讀懂深度學習中的熱點問題
2012年多倫多大學的研究人員首次使用深度學習在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中獲勝,深度學習漸漸被人們所熟知。而對于AI行業(yè)的從業(yè)者來說,深度學習下的計算機視覺,是使計算機能夠理解圖像背景的一門重要學科,也是人工智能中最具挑戰(zhàn)性的領域之一。目前,國內計算機視覺飛速發(fā)展,有了曠視科技face++、商湯科技、極鏈科技Video++等優(yōu)質企業(yè)。那么,深度學習究竟是什么呢?本文將詳細的解釋當前深度學習下的兩個熱點問題。
本文引用地址:http://2s4d.com/article/201901/396926.htm深度學習這一想法本身并不新穎,早在1959年就被討論過。當時受限于算法、硬件水平及數據量的限制,沒有得到很好的發(fā)展。近60年,隨著硬件水平的不斷提升,數據量的爆炸式增長,深度學習再一次煥發(fā)出勃勃生機,并展現出優(yōu)異的性能。
而計算機視覺領域中關鍵的深度學習,也成為了被關注的焦點。人工神經網絡的概念是深度學習算法的主要組成部分,已經存在數十年,第一個神經網絡可以追溯到20世紀50年代。由于數十年的研究以及數據和計算資源的可用性,深度學習的概念已經從實驗室走出并進入實際領域。
那么深度學習和機器學習是一回事么?
深度學習是一個非常復雜的計算機科學領域,它涉及許多高級數學概念。但在過去幾年中,學術界已經創(chuàng)建了大量的工具和庫來抽象出潛在的復雜性,并使你能夠無須解決過多的數學問題來開發(fā)深度學習模型。
深度學習和機器學習并不相同,深度學習是機器學習的一個子集。通常,機器學習適用于基于訓練數據模型和行為規(guī)則的所有技術,ML技術已經投入生產使用了很長時間。在深度學習之前,科學家們必須在編寫“功能”或模塊方面投入大量精力,這些功能可以執(zhí)行模型想要執(zhí)行的任務的一小部分。例如,如果你想要創(chuàng)建一個可以檢測物體的AI模型,你將編寫一段程序來檢測這個物體的特征,而且必須使這些程序足夠強大,以便從不同角度和不同光照條件下檢測這些特征,并告訴不同的物體之間的差異。經過以上這些操作后,你才可以在這些基礎上進行基礎學習。
深度學習是科學的嗎?
盡管深度學習過程可以用數學符號描述,但這個過程本身是不科學的。深度學習就像一個黑匣子,我們無法理解這個系統(tǒng)是如何理解處理特征并完成相關任務的。
以卷積操作舉例,正如TensorFlow手冊中所說,卷積層發(fā)現相關性。許多草葉通常代表一個草坪,在TensorFlow中,系統(tǒng)會花費大量時間來發(fā)現這些相關性。一旦發(fā)現了某些相關性,這種關聯(lián)會導致模型中某些權重的調整,從而使得特征提取正確。但從本質上來說,所有的相關性開始時對于模型來說都被遺忘了,必須在每次前向傳播和梯度下降的過程中來重新發(fā)現。這種系統(tǒng)實際上是從錯誤中吸取教訓,即模型輸出與理想輸出之間的誤差。
前向和反向傳播過程對圖像理解有一定的意義,有些人在文本上使用了相同的算法。幸運的是,針對于文本任務而言,有更加高效的算法。首先,我們可以使用大腦突觸或編程語言中的常規(guī)指針或對象引用顯式地表示所發(fā)現的相關性,神經元與神經元之間有關聯(lián)。
所以說,無論是深度學習算法,還是有機學習,都不能說是科學的。它們在缺乏證據并信任相關性的前提下得出結論,而不堅持可證明的因果關系。大多數深層神經網絡編程很難得到理想結果并存在一定的誤差,只能通過從實驗結果中發(fā)現線索來改進模型。增加網絡層數不總是有效的,對于大多數深度神經網絡從業(yè)者而言,根據實驗結果來調整改進網絡就是他們的日常工作。沒有先驗模型,就沒有先驗估計。任何深層神經網絡可靠性和正確性的最佳估計,都是經過大量的實驗得到。
評論