新聞中心

EEPW首頁 > 業(yè)界動(dòng)態(tài) > 揭秘阿里打假AI大腦:數(shù)據(jù)總量186個(gè)國家圖書館,1 AI=50000人類,獲創(chuàng)新大獎(jiǎng)

揭秘阿里打假AI大腦:數(shù)據(jù)總量186個(gè)國家圖書館,1 AI=50000人類,獲創(chuàng)新大獎(jiǎng)

作者:李根 時(shí)間:2019-08-15 來源:量子位 收藏

本文經(jīng)新媒體量子位(公眾號 ID: Qbit)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

本文引用地址:http://2s4d.com/article/201908/403730.htm

“令人震驚的是,在打假這方面,美國竟然遠(yuǎn)遠(yuǎn)落后!”一個(gè)月前,美國司法委員會副主席、共和黨參議員道格·柯林斯痛陳美國被假貨所困的問題,其話言猶在耳,近日打假技術(shù)又拿下國內(nèi)高規(guī)格的技術(shù)大獎(jiǎng)。

8月9日,由工信部、公安部及網(wǎng)信辦三部委指導(dǎo)主辦的“中國人工智能高峰論壇”在廈門召開,經(jīng)過層層評選,巴巴知產(chǎn)保護(hù)科技大腦被三部委評為“人工智能創(chuàng)新之星” 。

知識產(chǎn)權(quán)保護(hù)所指,更喜聞樂見的叫法就是打假。而的知產(chǎn)保護(hù)科技大腦是一套阿里20年間積累的海量線上線下假貨特征庫、打假經(jīng)驗(yàn)聚合而成的算法技術(shù)系統(tǒng),獨(dú)創(chuàng)“安全”大腦是核心。

這套系統(tǒng)24小時(shí)自動(dòng)運(yùn)轉(zhuǎn),96%的疑似侵權(quán)鏈接在發(fā)布的那一剎那就已被秒殺。在過去3年,阿里已使用這套技術(shù)協(xié)助全國31個(gè)省份、227個(gè)區(qū)縣的警方抓獲制售假嫌疑人4439人,搗毀制售假窩點(diǎn)4289個(gè)。

從美國議員點(diǎn)贊到國內(nèi)技術(shù)大獎(jiǎng),可以說時(shí)節(jié)已至,阿里打假正進(jìn)入爆發(fā)性收獲階段。量子位也了解到這背后的安全AI運(yùn)作之力、創(chuàng)新之功,接下來為大家一一揭秘。

1 AI 大腦=5 萬人類

知產(chǎn)保護(hù)科技大腦,就是誠心和技術(shù)創(chuàng)新的集大成產(chǎn)品。

該“大腦”完全由阿里自主研發(fā),已經(jīng)被廣泛應(yīng)用于阿里生態(tài)內(nèi)外,對假貨、山寨、侵權(quán)盜版等進(jìn)行偵測和打擊。

而且作為一支上崗AI,各方面實(shí)力,不僅比人類干得好,而且很多能力人類干不了。

阿里方面公布了一系列驚人數(shù)據(jù)表現(xiàn):

如果人工查看1張圖片的信息需要10秒鐘,那么5萬人同時(shí)工作的效率才能勉強(qiáng)趕上“知產(chǎn)保護(hù)科技大腦”掃描甄別圖片的速度。淘寶天貓平臺每日新發(fā)商品量以千萬計(jì),如果人工巡查,138889人工作1天才能把這項(xiàng)工作完成。

阿里安全圖靈實(shí)驗(yàn)室負(fù)責(zé)人薛暉透露,這套系統(tǒng)的樣本數(shù)據(jù)總量相當(dāng)于186個(gè)中國國家圖書館藏量,僅累積的打假圖片樣本量就超過137億張,用0.3毫米的標(biāo)準(zhǔn)相紙打印疊加后高達(dá)4110千米,是世界最高建筑迪拜塔的4964倍,約等于464個(gè)珠穆朗瑪峰。

驚人的效果背后是阿里在安全場景里不斷進(jìn)化技術(shù)力量所鍛造的“安全AI”風(fēng)控體系。

安全AI如何服務(wù)知識產(chǎn)權(quán)保護(hù)?

所謂安全AI,是指安全場景中進(jìn)化出的AI,擁有更強(qiáng)、更多元化的能力;與當(dāng)前通用AI的理念不同,阿里安全更注重在業(yè)務(wù)安全領(lǐng)域垂直縱深的技術(shù)積淀,開發(fā)出適應(yīng)更多安全場景的新一代AI,讓傳統(tǒng)的安全問題找到新的AI解法。阿里在今年年初提出這一全新理念,稱其將成為未來網(wǎng)絡(luò)安全問題的核心解法。

據(jù)悉,阿里知產(chǎn)科技大腦的秘密在于四大智能核心引擎,涵蓋阿里上百項(xiàng)自主研發(fā)的安全AI技術(shù)。分而解之,涉及感知引擎、認(rèn)知引擎、決策引擎和計(jì)算引擎。

實(shí)際也是通用人工智能(AGI)必不可少的四大引擎,只是阿里垂直為打假服務(wù)。

從項(xiàng)目申報(bào)說明里,也能尋得宏觀架構(gòu)脈絡(luò)。

感知引擎:核心技術(shù)是計(jì)算機(jī)視覺技術(shù)及語音識別技術(shù),是整個(gè)系統(tǒng)的感官系統(tǒng),是對象識別的基礎(chǔ),為形成后續(xù)一系列處理動(dòng)作邁出第一步。

包括,用于開店身份認(rèn)證環(huán)節(jié)的人臉識別、聲紋識別、活體檢測等生物識別技術(shù);用于開店資質(zhì)核驗(yàn)環(huán)節(jié)的證件識別、篡改檢測技術(shù);用于線上商品識別的商標(biāo)檢測、物體檢測、光學(xué)字符識別技術(shù);用于營銷環(huán)節(jié)檢測的廣告圖片分析和視頻直播監(jiān)測技術(shù),以及用于原創(chuàng)作品保護(hù)的多媒體檢索和圖像水印技術(shù)等。

正是“感官系統(tǒng)”精準(zhǔn)的語音、圖像、音頻、視頻感知能力,整個(gè)系統(tǒng)才能在數(shù)億復(fù)雜數(shù)據(jù)中準(zhǔn)確識別出需要保護(hù)和防御的對象,進(jìn)行下一步處理。

認(rèn)知引擎:核心技術(shù)是自然語言處理技術(shù)

認(rèn)知引擎是系統(tǒng)的“翻譯官”,讓機(jī)器懂得文字的意思、人類聲音的含義,以及人們動(dòng)作的性質(zhì),從而判斷善意惡意、危險(xiǎn)安全。

具體包括針對海量商品結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建的知識圖譜技術(shù);面向海外電商的多語言分析和機(jī)器翻譯技術(shù),針對外部反饋的評價(jià)、輿情進(jìn)行識別的語義分析技術(shù);以及融合多模態(tài)信息,對商品的全面認(rèn)知和理解的技術(shù)。

第三,決策引擎:核心技術(shù)包括深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)兩塊,用來解決現(xiàn)實(shí)中的復(fù)雜決策問題。

它是系統(tǒng)的“軍師”,決定了系統(tǒng)該如何動(dòng)作,如何更合理有效地作出最佳應(yīng)對。例如當(dāng)面臨商家實(shí)時(shí)博弈、信息內(nèi)容的變異,以及黑產(chǎn)的惡意攻擊時(shí),在全局視角下做出更有利的決策。

最后還有計(jì)算引擎,包括實(shí)時(shí)指標(biāo)計(jì)算系統(tǒng)、分布式異構(gòu)計(jì)算系統(tǒng)、和大規(guī)模圖神經(jīng)網(wǎng)絡(luò)系統(tǒng)。

這是打假AI大腦的發(fā)動(dòng)機(jī),它強(qiáng)大的性能保證了系統(tǒng)在數(shù)千并發(fā)、數(shù)十億數(shù)據(jù)面前坦然自若、精準(zhǔn)高效。

計(jì)算引擎背后,支撐的是阿里云機(jī)器學(xué)習(xí)平臺 – PAI 3.0。

它可以實(shí)現(xiàn)單任務(wù)支持上千worker并發(fā)訓(xùn)練,并支持5k+超大規(guī)模異構(gòu)計(jì)算集群,保證全天候監(jiān)控?cái)?shù)十億商品異常情況,以及對經(jīng)營者行為的全方位監(jiān)督。

臺上一分鐘,技術(shù)20年功

值得一提的是,四大引擎架構(gòu)宏觀,但背后每一項(xiàng)技術(shù)積累,都是工程師們?nèi)找箍喙Φ慕Y(jié)果。

值得一提的是,打假AI大腦是阿里安全“安全AI”落地應(yīng)用場景之一。阿里在高風(fēng)險(xiǎn)、強(qiáng)對抗的場景中不斷進(jìn)化AI的力量,通過小樣本學(xué)習(xí)、多模態(tài)、自監(jiān)督學(xué)習(xí)等新技術(shù)的持續(xù)應(yīng)用,在內(nèi)容安全、新零售安全、交易安全等百余場景中持續(xù)應(yīng)用,其凝聚著阿里安全圖靈實(shí)驗(yàn)室在AI領(lǐng)域超過10年的技術(shù)積淀,實(shí)現(xiàn)水滴石穿。

從最近阿里安全圖靈實(shí)驗(yàn)室在人工智能頂會的論文中,不難發(fā)現(xiàn)其功力所在。

這是阿里發(fā)表于ECCV Workshop 2018的論文,核心分享了其在視頻分析領(lǐng)域的技術(shù)進(jìn)展。

也是阿里從視頻中識假打假,保護(hù)原創(chuàng)的秘訣所在。

當(dāng)前業(yè)內(nèi)通行的視頻分析,往往先預(yù)訓(xùn)練CNN網(wǎng)絡(luò)提取特征分類,其后采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN、LSTM)進(jìn)行序列建模。

但視頻的特征序列一般較長,且含有多級結(jié)構(gòu)(hierarchical data structure),即一個(gè)視頻包含幀、鏡頭、場景、事件等。

而且?guī)c幀、鏡頭與鏡頭間的關(guān)系十分復(fù)雜,不僅僅是前后幀的順序關(guān)系,通過一般的序列建模方法,RNN無法表達(dá)如此復(fù)雜的關(guān)系,建模效果較差。

因此阿里研究團(tuán)隊(duì)通過深度卷積圖神經(jīng)網(wǎng)絡(luò)(DCGN)對視頻的幀、鏡頭、事件進(jìn)行多級的建模,逐漸地從幀級、鏡頭級,一直到視頻級進(jìn)行抽象,從而獲得視頻全局的表達(dá),進(jìn)而進(jìn)行分類:

最后方法在youtube8m數(shù)據(jù)集上驗(yàn)證后,效果相對其他經(jīng)典的序列建模方法,都有提升。

論文傳送門:https://arxiv.org/abs/1906.00377

還有自然語言處理領(lǐng)域的進(jìn)展,同樣是知產(chǎn)保護(hù)科技大腦的關(guān)鍵技術(shù)。

阿里安全圖靈實(shí)驗(yàn)室入選IJCAI 2019的文章,主題是面向?qū)ο蟮那楦蟹治?,主要目?biāo)是挖掘出評論對象,同時(shí)判斷情感表達(dá)的極性。

一般而言,很多對于商品質(zhì)量描述的蛛絲馬跡,會隱藏在用戶對商品的評論中,卻很難從商品本身中發(fā)現(xiàn)問題,這也是NLP技術(shù)能夠施展拳腳的場景。

論文中提出的方法,通俗來說是利用全局信息、結(jié)合上下文語境去識別情感對象,而不再是預(yù)測每個(gè)字對應(yīng)的序列標(biāo)簽。

這種方法基于詞塊方法,提出更簡單高效的聯(lián)合模型,同時(shí)抽取情感表達(dá)對象以及判斷其情感極性。

具體步驟上,首先對評論語句中的所有候選詞塊進(jìn)行向量表示,然后提出了一種基于詞塊的注意力機(jī)制來預(yù)測詞塊對應(yīng)的標(biāo)簽和極性。

最后公開數(shù)據(jù)集評測對比后,證明比現(xiàn)有方法表現(xiàn)更好。



上一頁 1 2 下一頁

關(guān)鍵詞: 阿里 AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉