新聞中心

EEPW首頁(yè) > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 中國(guó)工程院院士李德毅:大數(shù)據(jù)突破點(diǎn)在于聚類(lèi)

中國(guó)工程院院士李德毅:大數(shù)據(jù)突破點(diǎn)在于聚類(lèi)

作者: 時(shí)間:2015-06-08 來(lái)源:騰訊科技 收藏

  2015年4月9日,第三屆中國(guó)電子信息博覽會(huì)在深圳召開(kāi)。工業(yè)和信息化部電子信息司司長(zhǎng)刁石京主持開(kāi)展了新一代信息技術(shù)產(chǎn)業(yè)發(fā)展高峰論壇。中國(guó)工程院院士李德毅發(fā)表了主題為“認(rèn)知”的演講,對(duì)的發(fā)展前景做出了展望。

本文引用地址:http://2s4d.com/article/275351.htm

  

中國(guó)工程院院士李德毅:大數(shù)據(jù)突破點(diǎn)在于聚類(lèi)

 

  人類(lèi)社會(huì)文明已經(jīng)進(jìn)入到了數(shù)據(jù)密集型的新時(shí)代,已經(jīng)成為重要的資產(chǎn)。在李德毅看來(lái),大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù),它反映的是網(wǎng)絡(luò)時(shí)代的一種客觀存在。而數(shù)據(jù)數(shù)量巨大,價(jià)值密度低,實(shí)時(shí)在線,多源異構(gòu),給人們的認(rèn)知造成了很大的困擾。

  李德毅認(rèn)為,人類(lèi)的認(rèn)知科學(xué)要想有所突破,首先就要在大數(shù)據(jù)聚類(lèi)上去的突破,聚類(lèi)是挖掘大數(shù)據(jù)資產(chǎn)價(jià)值的第一步。這種聚類(lèi)是跨學(xué)科、跨領(lǐng)域、跨媒體的,并且已經(jīng)成為許多行業(yè)的核心競(jìng)爭(zhēng)力。人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化,但特定的情境下的認(rèn)知能力是否可以先局部地形式化。

  智能機(jī)器人是物聯(lián)網(wǎng)不可或缺的端設(shè)備,一直以來(lái)都是人類(lèi)關(guān)注的重點(diǎn)。李德毅認(rèn)為,機(jī)器人既使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動(dòng)者,機(jī)器人是大數(shù)據(jù)的認(rèn)知的典型代表。人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化,但特定的情境下的認(rèn)知能力是否可以先局部地形式化,而機(jī)器人就是人類(lèi)的思維移植。

  以下為李德毅演講全文:

  尊敬的懷部長(zhǎng),各位來(lái)賓,女士們,先生們,我匯報(bào)的主題是大數(shù)據(jù)認(rèn)知,云計(jì)算、大數(shù)據(jù)、認(rèn)知,大家知道認(rèn)知是現(xiàn)在全球都感興趣的話(huà)題。所謂認(rèn)知,就是怎么樣獲取知識(shí)和技能的能力,所以我的第一個(gè)小標(biāo)題是講一下認(rèn)知。

  大數(shù)據(jù)標(biāo)志著一個(gè)新時(shí)代的到來(lái),這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無(wú)所不在的互聯(lián)網(wǎng)帶來(lái)的方便的多樣化信息服務(wù),同時(shí)還包含區(qū)別于物質(zhì)的數(shù)據(jù)資源的價(jià)值發(fā)現(xiàn)和價(jià)值轉(zhuǎn)換,以及由大數(shù)據(jù)帶來(lái)的精神和文化方面的嶄新現(xiàn)象。

  大數(shù)據(jù)來(lái)源于人類(lèi)的測(cè)量、記錄和分析世界的渴望和無(wú)盡的追求。隨著信息技術(shù),尤其是傳感器、通信、計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,人類(lèi)獲取數(shù)據(jù)的手段越來(lái)越多,速度大大加快、成本急劇降低,層次和尺度更為精細(xì),揭示自然現(xiàn)象和社會(huì)現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,這樣一來(lái),大數(shù)據(jù)成為網(wǎng)絡(luò)時(shí)代人類(lèi)社會(huì)的重要資產(chǎn)。

  我想說(shuō)一個(gè)觀點(diǎn),大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù),我個(gè)人認(rèn)為,它反映的是網(wǎng)絡(luò)時(shí)代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以三個(gè)數(shù)量級(jí)的階梯迅速增長(zhǎng),是用傳統(tǒng)工具難以認(rèn)知的,具有更大挑戰(zhàn)的數(shù)據(jù)。

  數(shù)據(jù)量巨大,價(jià)值密度低,實(shí)時(shí)在線,多源異構(gòu),怎么辦?舉個(gè)例子吧!聚類(lèi),物以類(lèi)聚,人以群分,這是人類(lèi)幾千年來(lái)認(rèn)識(shí)世界和社會(huì)的基本能力,是從大數(shù)據(jù)中發(fā)現(xiàn)價(jià)值必須面對(duì)的一個(gè)普遍性、基礎(chǔ)性問(wèn)題,是認(rèn)知科學(xué)作為學(xué)科的學(xué)科,要解決的首要問(wèn)題。無(wú)論是政治、經(jīng)濟(jì)、文學(xué)、歷史、社會(huì)、文化、還是數(shù)理、化工、醫(yī)農(nóng)、交通、地理、各行各業(yè)的大數(shù)據(jù)或宏觀或微觀的任何價(jià)值發(fā)現(xiàn)。

  2008年XX專(zhuān)刊登了一篇文章,人們對(duì)小標(biāo)題關(guān)注不夠,這個(gè)小標(biāo)題講的PB時(shí)代的科學(xué)怎么做。大數(shù)據(jù)分析和挖掘的首要任務(wù)是聚類(lèi),這種聚類(lèi)是跨學(xué)科、跨領(lǐng)域、跨媒體的。

  聚類(lèi)的挑戰(zhàn)性很多,有人是并行計(jì)算等等,我不細(xì)講了。我想說(shuō)的是大數(shù)據(jù)聚類(lèi)表現(xiàn)形態(tài)。

  我想用幾個(gè)例子來(lái)講一講,人類(lèi)走過(guò)了幾千年的實(shí)驗(yàn)科學(xué)、幾百年的理論科學(xué),保險(xiǎn)是一個(gè)很傳統(tǒng)的行業(yè),基于概念評(píng)估的生意,保險(xiǎn)公司對(duì)車(chē)險(xiǎn)客戶(hù)是這樣聚類(lèi)的:A類(lèi)連續(xù)兩年沒(méi)有出車(chē)禍的,B類(lèi),最近一年沒(méi)有出車(chē)禍的,C類(lèi)過(guò)去一年出了一次車(chē)禍的,D類(lèi)過(guò)去一年出了兩此及以上車(chē)禍的。我從機(jī)場(chǎng)到深圳來(lái),你坐飛機(jī)從北京到深圳,保險(xiǎn)公司給你付了,我一了解,這個(gè)保險(xiǎn)是20塊錢(qián),這個(gè)保險(xiǎn)公司買(mǎi)了你三個(gè)大數(shù)據(jù),身份證,還有你的手機(jī)號(hào),各位企業(yè)、各位領(lǐng)導(dǎo),各位老百姓,你們想一想。

  物聯(lián)網(wǎng)時(shí)代,當(dāng)汽車(chē)成為輪式機(jī)器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個(gè)大數(shù)據(jù)發(fā)生體,每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車(chē),都會(huì)記錄在岸,利用大數(shù)據(jù)聚類(lèi),保險(xiǎn)公司可對(duì)一個(gè)車(chē)況好、駕駛習(xí)慣好、常走線路事故率低,不勤開(kāi)車(chē)的特定客戶(hù),給予更大的優(yōu)惠,而對(duì)風(fēng)險(xiǎn)太高的客戶(hù)報(bào)高價(jià)甚至拒絕,例如出租車(chē)司機(jī)跑的比老百姓多得多,總之能夠給出包括保險(xiǎn)費(fèi)支付方式在內(nèi)的個(gè)性化解決方案,這就顛覆了保險(xiǎn)公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類(lèi)成為保險(xiǎn)公司的核心競(jìng)爭(zhēng)力,我擴(kuò)張一下,就是大數(shù)據(jù)聚類(lèi)成為很多行業(yè)的核心競(jìng)爭(zhēng)力。


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: 大數(shù)據(jù)

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉