博客專欄

EEPW首頁 > 博客 > 有哪些深度學(xué)習(xí)效果不如傳統(tǒng)方法的經(jīng)典案例?

有哪些深度學(xué)習(xí)效果不如傳統(tǒng)方法的經(jīng)典案例?

發(fā)布人:計算機(jī)視覺工坊 時間:2021-04-12 來源:工程師 發(fā)布文章

作者丨桔了個仔、莫笑傅立葉、LinT

來源丨知乎問答

編輯丨極市平臺

深度學(xué)習(xí)作為目前最前沿的科技領(lǐng)域之一,一般都引導(dǎo)著科技進(jìn)步,但是是否存在一些深度學(xué)習(xí)的效果反而不如傳統(tǒng)方法的案例呢?本文匯總了一些該問題下的優(yōu)質(zhì)回答,回答均來自知乎。 >>加入極市CV技術(shù)交流群,走在計算機(jī)視覺的最前沿

1.png

問題鏈接:https://www.zhihu.com/question/451498156

# 回答一

作者:桔了個仔

來源鏈接:https://www.zhihu.com/question/451498156/answer/1802577845

對于解釋性有要求的領(lǐng)域,基本深度學(xué)習(xí)是沒法和傳統(tǒng)方法比的。我這幾年都在做風(fēng)控/反洗錢的產(chǎn)品,但監(jiān)管要求我們的決策要可解釋性,而我們曾經(jīng)嘗試深度學(xué)習(xí),解釋性很難搞,而且,效果也不咋地。對于風(fēng)控場景,數(shù)據(jù)清洗是非常重要的事,否則只會是garbage in garge out。

在寫上面內(nèi)容時,我想起前兩年看的一篇文章:《你不需要ML/AI,你需要SQL》

https://news.ycombinator.com/item?id=17433752

作者是尼日利亞的軟件工程師Celestine Omin,在尼日利亞最大的電商網(wǎng)站之一Konga工作。我們都知道,對老用戶精準(zhǔn)營銷和個性化推薦,都是AI最為常用的領(lǐng)域之一。當(dāng)別人在用深度學(xué)習(xí)搞推薦時,他的方法顯得異常簡單。他只是跑了一遍數(shù)據(jù)庫,篩選出所有3個月沒有登錄過的用戶,給他們推優(yōu)惠券。還跑了一遍用戶購物車的商品清單,根據(jù)這些熱門商品,決定推薦什么相關(guān)聯(lián)的商品。

結(jié)果,他這種簡單的而基于SQL的個性化推薦,大多數(shù)營銷郵件的打開率在7-10%之間,做得好時打開率接近25-30%,是行業(yè)平均打開率的三倍。

當(dāng)然,這個例子并不是告訴大家,推薦算法沒用,大家都應(yīng)該用SQL,而是說,深度學(xué)習(xí)應(yīng)用時,需要考慮成本,應(yīng)用場景等制約因素。我在之前的回答里(算法工程師的落地能力具體指的是什么?),說到過算法落地時需要考慮實際制約因素。

https://news.ycombinator.com/item?id=17433752

2.jpg

而尼日利亞的電商環(huán)境,依然出于非常落后的狀態(tài),物流也跟不上。即使使用深度學(xué)習(xí)方法,提升了效果,實際對公司整體利潤并不會有太大影響。

所以,算法落地時必須「因地制宜」否則,又會出現(xiàn)「電風(fēng)扇吹香皂盒」的情況。

某大企業(yè)引進(jìn)了一條香皂包裝生產(chǎn)線,結(jié)果發(fā)現(xiàn)這條生產(chǎn)線有個缺陷:常常會有盒子里沒裝入香皂??偛荒馨芽蘸凶淤u給顧客啊,他們只得請了一個學(xué)自動化的博士后設(shè)計一個方案來分揀空的香皂盒。

博士后拉起了一個十幾人的科研攻關(guān)小組,綜合采用了機(jī)械、微電子、自動化、X射線探測等技術(shù),花了90萬,成功解決了問題。每當(dāng)生產(chǎn)線上有空香皂盒通過,兩旁的探測器會檢測到,并且驅(qū)動一只機(jī)械手把空皂盒推走。

中國南方有個鄉(xiāng)鎮(zhèn)企業(yè)也買了同樣的生產(chǎn)線,老板發(fā)現(xiàn)這個問題后大為發(fā)火,找了個小工來說“你他媽給老子把這個搞定,不然你給老子爬走?!毙」ず芸煜氤隽宿k法他花了190塊錢在生產(chǎn)線旁邊放了一臺大功率電風(fēng)扇猛吹,于是空皂盒都被吹走了。

(雖然只是個段子)

深度學(xué)習(xí)是錘子,而世間萬物不都是釘子。

# 回答二

作者:莫笑傅立葉

來源鏈接:https://www.zhihu.com/question/451498156/answer/1802730183

有兩個比較常見的場景:

1.追求可解釋性的場景。

深度學(xué)習(xí)非常善于解決分類和回歸問題,但對于什么影響了結(jié)果的解釋很弱,如果實際業(yè)務(wù)場景中,對于解釋性要求很高,諸如以下場景,那么深度學(xué)習(xí)往往被干翻。

3.jpg

2. 許多運籌優(yōu)化場景

諸如調(diào)度,規(guī)劃,分配問題,往往這類問題無法很好的轉(zhuǎn)化為監(jiān)督學(xué)習(xí)格式,因此常采用優(yōu)化算法。在現(xiàn)在研究中,在求解過程中往往融合深度學(xué)習(xí)算法更好地求解,但總體而言,模型本身還不是深度學(xué)習(xí)為主干。

深度學(xué)習(xí)是一個非常好的求解思路,但不是唯一,甚至在落地時依舊問題很大。若將深度學(xué)習(xí)融合于優(yōu)化算法,作為求解的一個部件,依舊有很大的用武之地。

總之,

4.png

# 回答三

作者:LinT

來源鏈接:https://www.zhihu.com/question/451498156/answer/1802516688

這個問題要分場景看。深度學(xué)習(xí)固然免去了特征工程的麻煩,但是在一些場景下應(yīng)該很難應(yīng)用:

應(yīng)用對時延有高要求,而對精度沒有那么高的要求,這時簡單的模型可能是更好的選擇;

一些數(shù)據(jù)類型,例如tabular數(shù)據(jù),可能更適合使用基于樹的模型等統(tǒng)計學(xué)習(xí)模型而不是深度學(xué)習(xí)模型;

模型決策有重大影響,例如安全相關(guān)、經(jīng)濟(jì)決策相關(guān),要求模型具有可解釋性,那么線性模型或者基于樹的模型,相對深度學(xué)習(xí)是更好的選擇;

應(yīng)用場景決定了數(shù)據(jù)采集難,使用深度學(xué)習(xí)有過擬合的風(fēng)險。

真實的應(yīng)用都是從需求出發(fā)的,拋開需求(精度、時延、算力消耗)談表現(xiàn)是不科學(xué)的。如果把問題中的『干翻』限定到某個指標(biāo)上,可能討論范圍可以縮小一些。

本文僅做學(xué)術(shù)分享,如有侵權(quán),請聯(lián)系刪文。

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞:

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉