博客專欄

EEPW首頁 > 博客 > 讓機(jī)器“看”得更清楚!計(jì)算機(jī)視覺正在成為AI的“時(shí)代寵兒”

讓機(jī)器“看”得更清楚!計(jì)算機(jī)視覺正在成為AI的“時(shí)代寵兒”

發(fā)布人:深科技 時(shí)間:2021-08-27 來源:工程師 發(fā)布文章

當(dāng)今時(shí)代,處于第三波浪潮的 AI 正迎來加速發(fā)展時(shí)期,AI 技術(shù)不斷突破,應(yīng)用大規(guī)模爆發(fā),大量布局 AI 的科技巨頭和創(chuàng)業(yè)公司逐漸涌上潮頭。

計(jì)算機(jī)視覺作為 AI 市場的最大分支,無論是在技術(shù)成熟度、商業(yè)化進(jìn)程,還是在市場增長速度、投融資熱度等方面,自始至終都是人工智能領(lǐng)域最熱門的行業(yè)之一。


計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域幾乎涵蓋了我們所知的所有行業(yè),如自動(dòng)駕駛、金融風(fēng)控、安防、新零售、智能手機(jī)、智能機(jī)器人......

據(jù) IDC 預(yù)測,中國人工智能市場將在 2024 年形成千億市場規(guī)模,而計(jì)算機(jī)視覺占比將超過一半,未來廣闊前景引人遐想。

計(jì)算機(jī)視覺邁入發(fā)展快車道


人工智能大家已經(jīng)耳熟能詳,但計(jì)算機(jī)視覺在排除行業(yè)從事者之外,卻很少有人能解釋的清楚。

那么究竟何謂計(jì)算機(jī)視覺呢?

簡單來說,人類通過眼睛感知和理解周邊的世界,而計(jì)算機(jī)視覺則是一門研究如何使機(jī)器“看”的科學(xué)。更進(jìn)一步的說,就是用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。


20 世紀(jì) 60 年代,貝爾實(shí)驗(yàn)室研發(fā)的一種將光子轉(zhuǎn)化為電脈沖的器件,很快成為了高質(zhì)量數(shù)字圖像采集任務(wù)的新寵,逐漸應(yīng)用于工業(yè)相機(jī)傳感器,標(biāo)志著計(jì)算機(jī)視覺走上應(yīng)用舞臺;70 年代中期,MIT人工智能實(shí)驗(yàn)室正式開設(shè)計(jì)算機(jī)視覺課程;1982 年,《視覺》一書的問世,標(biāo)志著計(jì)算機(jī)視覺成為了一門獨(dú)立學(xué)科。

進(jìn)入 21 世紀(jì)以來,計(jì)算機(jī)視覺領(lǐng)域蓬勃發(fā)展,各種理論與方法大量涌現(xiàn),并在多個(gè)核心問題上取得了令人矚目的成果。尤其是近年來,國內(nèi)外巨頭紛紛布局計(jì)算機(jī)視覺領(lǐng)域,開設(shè)計(jì)算機(jī)視覺研究實(shí)驗(yàn)室,并以計(jì)算機(jī)視覺新系統(tǒng)和技術(shù)賦能原有的業(yè)務(wù),開拓全新戰(zhàn)場。

企業(yè)差異化路徑漸顯
隨著 AI 時(shí)代的到來,計(jì)算機(jī)視覺賽道的商業(yè)化進(jìn)程不斷加速,計(jì)算機(jī)視覺已經(jīng)成為傳統(tǒng)產(chǎn)業(yè)不可或缺的重要環(huán)節(jié)。

計(jì)算機(jī)視覺龍頭企業(yè)也逐漸呈現(xiàn)出不同方向的差異化經(jīng)營戰(zhàn)略,有的發(fā)力云端平臺、有的聚焦于前端軟硬件一體方案、有的專注醫(yī)療影像分析、有的深入金融領(lǐng)域。

以 “AI 四小龍” 為例,商湯科技、依圖科技、曠視科技、云從科技在各自道路上的差異化戰(zhàn)略開始顯現(xiàn),百花齊放的行業(yè)盛世雛形正逐漸形成。

商湯科技創(chuàng)立于 2014 年,專注于計(jì)算機(jī)視覺與深度學(xué)習(xí)底層法的研究開發(fā),以原創(chuàng)技術(shù)為核心賦能產(chǎn)業(yè),應(yīng)用覆蓋行業(yè)范圍最為廣泛。當(dāng)前商湯科技正在集中于計(jì)算機(jī)視覺的后端市場,聚焦于云端、平臺的搭建,將自身定位于基礎(chǔ)平臺型公司。

例如在安防領(lǐng)域,商湯正在全力打造城市級視覺中心平臺,希望通過自身強(qiáng)大的 AI 算法協(xié)助城市級別的海量數(shù)據(jù)處理。

此外商湯還聯(lián)合湖北省博物館打造“虛擬曾侯乙編鐘”,通過 AR 技術(shù)讓觀眾敲響兩千年前的古代樂器;與故宮文化合作,在“金榜題名”互動(dòng)式展覽中將孔子等比例還原,讓現(xiàn)代人也能與孔圣人行禮,實(shí)現(xiàn)“跨時(shí)空互動(dòng)”。

曠視科技成立于 2011 年,深耕金融安全、城市安防、手機(jī) AR、商業(yè)物聯(lián),工業(yè)機(jī)器人五大核心行業(yè),致力于為企業(yè)級用戶提供全球領(lǐng)先的人工智能產(chǎn)品和行業(yè)解決方案。

曠視科技的發(fā)展戰(zhàn)略與商湯截然相反,作為一個(gè)以人工智能算法起家的“輕”企業(yè),曠視正在從計(jì)算機(jī)視覺算法后端向前端覆蓋。為擺脫依靠軟件平臺變現(xiàn)難的問題,曠視科技的研發(fā)工作向產(chǎn)業(yè)鏈上游的硬件端延伸,推出了人工智能攝像頭、邊緣計(jì)算設(shè)備等。

依圖科技成立于 2012 年,致力于將計(jì)算機(jī)視覺人工智能創(chuàng)新性研究與行業(yè)應(yīng)用相結(jié)合,具備較為先進(jìn)的算法和極強(qiáng)的工程應(yīng)用能力。依圖科技強(qiáng)調(diào)優(yōu)質(zhì)算法基礎(chǔ)上產(chǎn)品化、工程化能力的重要性,并將安防和醫(yī)學(xué)影像分析作為其發(fā)展的重要戰(zhàn)略。
依圖科技與北京協(xié)和醫(yī)院、華西醫(yī)院、浙江省人民醫(yī)院、復(fù)旦大學(xué)附屬腫瘤醫(yī)院等多家頂級三甲醫(yī)院合作,推出了 care.ai 醫(yī)療智能全棧式產(chǎn)品解決方案,為醫(yī)院提供跨科室的多場景應(yīng)用系統(tǒng)和數(shù)據(jù)分析平臺。

云從科技于 2015 年成立,孵化于中科院重慶研究所,源于云從科技深厚的國家隊(duì)背景,云從科技與國內(nèi)大型****合作密切。

云從自主研發(fā)的金融行業(yè)解決方案已覆蓋金融各個(gè)領(lǐng)域,包括****、互聯(lián)網(wǎng)金融、證券、基金、保險(xiǎn)、汽車金融等。目前,云從科技在金融領(lǐng)域的布局,短期內(nèi)以搶占****線下網(wǎng)點(diǎn)智慧化改造市場為主,長期則是切入金融機(jī)構(gòu)核心風(fēng)控業(yè)務(wù)。

除了 “AI四小龍”,還有一些計(jì)算機(jī)視覺企業(yè)同樣憑借先進(jìn)技術(shù)走上了差異化的發(fā)展道路,在AI市場獨(dú)樹一幟的同時(shí)確定了自身的領(lǐng)先地位。

以影譜科技為例,作為 AI 影像生產(chǎn)行業(yè)領(lǐng)航者,影譜科技對于計(jì)算機(jī)視覺應(yīng)用的另一大爆發(fā)點(diǎn)——智能影像有著極為深刻的認(rèn)知。

作為 AI 視覺生成技術(shù)的最佳代表,影譜科技定義了 AI 影像生產(chǎn)引擎 AGC,推出全新的智能影像檢索、生成、渲染及創(chuàng)建工具集、云服務(wù),升級的數(shù)字人解決方案,及高質(zhì)量光照與物理模擬系統(tǒng)等,以 AI 生成技術(shù)賦能傳媒、文教、體育等多個(gè)產(chǎn)業(yè);同時(shí),推出 AI+DT 深度融合的AI數(shù)字孿生引擎 ADT,用于提供商品數(shù)字模型和商業(yè)空間感知解決方案,全面構(gòu)建影像級、全模態(tài)、全場景、可交互的 AI 數(shù)字商業(yè)生態(tài)。

正是在影譜科技的獨(dú)家技術(shù)支持下,央視網(wǎng)體育首位虛擬 AI 主播正式推出上線,首次亮相即創(chuàng)造流量高峰。近日,影譜科技還與高端生活電器企業(yè)海爾智護(hù)達(dá)成戰(zhàn)略合作,將基于影譜 AI 數(shù)字孿生平臺共建家庭數(shù)智生態(tài)體系,把人工智能及數(shù)字化能力充分應(yīng)用到智能制造、消費(fèi)體驗(yàn)、數(shù)字化管理等環(huán)節(jié)中,為智能家電和消費(fèi)者搭建“數(shù)字橋梁”。

總的來說,差異化的戰(zhàn)略不僅有利于計(jì)算機(jī)視覺企業(yè)的成長,也將充分激發(fā)全行業(yè)發(fā)展?jié)摿?,打造出一個(gè)“百家爭鳴”的良性市場競爭格局
視覺技術(shù) “多點(diǎn)開花”
計(jì)算機(jī)視覺涉及多個(gè)技術(shù)分支,包括人臉識別、物體識別、場景識別、影像識別、手勢識別、視頻結(jié)構(gòu)化、OCR(光學(xué)字符識別)等。其中人臉識別可以說是布局最為廣泛且最為外界熟知的技術(shù),幾乎所有企業(yè)均有布局。

人臉識別是一種身份鑒定的識別技術(shù),非接觸性和非強(qiáng)制性特征使其在各類場景中廣泛應(yīng)用,比如金融領(lǐng)域的身份驗(yàn)證、零售環(huán)節(jié)的面部識別支付、商業(yè)服務(wù)領(lǐng)域的自動(dòng)識別客戶等方面。其中,“AI 四小龍” 的人臉識別準(zhǔn)確率甚至已超過 99%。


不過計(jì)算機(jī)視覺的發(fā)展并不局限于單點(diǎn)技術(shù)的爆發(fā)。事實(shí)上,商湯科技、曠視科技、影譜科技等企業(yè)在多項(xiàng)技術(shù)上其實(shí)均有布局。

比如商湯科技布局了智能影像、醫(yī)學(xué)圖像、智能汽車等技術(shù),近日還推出了集算力、算法、平臺于一身的 SenseCore 商湯 AI 大裝置??赏ㄟ^自動(dòng)化生產(chǎn),自適應(yīng)應(yīng)用的方式,全面解析物理世界所涉及的各種錯(cuò)綜復(fù)雜的數(shù)據(jù)應(yīng)用。簡單地說,有了 AI 大裝置這種基礎(chǔ)設(shè)施,在城市中的商圈、園區(qū)、街道等各種場景,都可以實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的智能化連接

曠視科技打造了 Brain++ AI 生產(chǎn)力平臺,核心技術(shù)除人臉識別,還包括計(jì)算機(jī)攝影學(xué)、智能視覺傳感器、機(jī)器人導(dǎo)航和定位等,“物體識別”“文本識別”“圖像分類”“物體檢測”等功能均可快速實(shí)現(xiàn),從而支持曠視科技向垂直領(lǐng)域快速擴(kuò)張;

影譜科技通過構(gòu)建影像商業(yè)化引擎 ACM、影像工業(yè)化引擎 AGC、數(shù)字孿生引擎 ADT 三重引擎,深度覆蓋智慧文娛、智慧媒體、智慧科教、數(shù)字商業(yè)等核心場景,提供一站式智能影像解決方案,助力關(guān)鍵產(chǎn)業(yè)數(shù)智化升級。

從數(shù)據(jù)收集、到算法模型,再到算力提升,雖然計(jì)算機(jī)視覺技術(shù)在不斷進(jìn)步,但與此同時(shí),多個(gè)行業(yè)痛點(diǎn)問題也隨之浮現(xiàn)。

首先是計(jì)算機(jī)視覺迫切需要填補(bǔ)海量數(shù)據(jù)計(jì)算需求所面臨的算力缺口,這意味著企業(yè)需要高額的成本用于算力訓(xùn)練;其次計(jì)算機(jī)視覺的應(yīng)用場景仍有拓展余地,而不應(yīng)總將注意力聚焦在無人駕駛、數(shù)字娛樂、安防監(jiān)控、醫(yī)療等少數(shù)領(lǐng)域;最后,一旦市場進(jìn)入平穩(wěn)發(fā)展的飽和期,企業(yè)或?qū)⒚媾R市場的篩選和淘汰。

不過“禍兮福之所倚,福兮禍之所伏”,這些問題的出現(xiàn)也代表著計(jì)算機(jī)視覺尚有廣闊的市場空間可供挖掘。隨著計(jì)算機(jī)視覺技術(shù)日漸成熟,企業(yè)商業(yè)化落地能力不斷提高,計(jì)算機(jī)視覺市場規(guī)?;?qū)⒂瓉硗黄菩园l(fā)展。

未來,伴隨著計(jì)算機(jī)從理論到應(yīng)用的速度加快,高質(zhì)量的各種視覺數(shù)據(jù)不斷沉淀,相信無論是在農(nóng)業(yè)還是工業(yè)領(lǐng)域,無論是視頻直播還是游戲,一定還會(huì)有更多好玩炫酷的計(jì)算機(jī)視覺應(yīng)用逐一亮相。

-End-


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 計(jì)算機(jī)視覺

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉