5月26日的貴陽數(shù)博會上,李彥宏出席了人工智能高峰論壇。李彥宏在演講中,從“為什么百度不是一家互聯(lián)網(wǎng)公司”講起,介紹了百度目前在人工智能領域的突破。當講到數(shù)據(jù)與算法哪個更重要的爭論時,他在“大數(shù)據(jù)”的主場直言不諱地說:“數(shù)據(jù)不是根本”。

演講全文:

大家好。感謝楊瀾的介紹,我其實很早就看了楊瀾拍的“人工智能”紀錄片,我還蠻驚訝的是楊瀾對人工智能有這么深入的了解,確實也花了很多工夫去采訪全球各個地方人工智能方面的大咖。

我對這個領域非常熱愛,以至于前兩天我們在重慶開百度聯(lián)盟峰會,當時我有一個演講,講到“百度不應該被稱作一個互聯(lián)網(wǎng)公司,而應該被稱作一個人工智能的公司”,昨天見到楊瀾她也問我為什么這么說?我當時在重慶沒有展開說,今天借這個機會正好講一下。

我覺得互聯(lián)網(wǎng)公司這個概念現(xiàn)在確實不是特別合適了,原因就是互聯(lián)網(wǎng)的普及程度已經(jīng)非常非常高了。比如說今天我們在這兒開會,這個酒店叫凱悅酒店,我們不會說凱悅酒店是一個電力公司,雖然我們在這個酒店不管干什么都要用到電,互聯(lián)網(wǎng)也是一樣的,任何一個公司今天在做它的業(yè)務的時候,不管是什么業(yè)務你都要用到互聯(lián)網(wǎng),所以這個時候再說我是一個互聯(lián)網(wǎng)公司,我覺得意義已經(jīng)不大了。

但是為什么說我們是一個人工智能公司呢?因為人工智能現(xiàn)在才剛剛開始進入到各個領域,很多技術(shù)還在飛速發(fā)展,很多應用還沒有獲得足夠多的重視,所以我們現(xiàn)在更希望給大家講人工智能帶來了哪些新的可能性。

剛才的片子里面其實也有很多的爭論,人工智能會不會是一個不歸路,會不會隨著技術(shù)的發(fā)展,給大家?guī)砗芏嗖豢深A知的后果?這里頭我想,首先要講一下我在這方面的判斷——很多時候是因為大家不了解所以才恐懼,很多人認為說人工智能就是讓計算機在模擬人腦的工作方法進行工作,其實這是一個很大的誤解,而且這個誤解是非常非常普遍的,幾乎我見到的人當中有一半的人都覺得人工智能是仿生學,就是讓計算機來模擬人的大腦神經(jīng)元是怎么工作的,怎么作出判斷的,怎么作出推演的,那我們也這么去做,其實這是錯誤的。

就拿深度神經(jīng)網(wǎng)絡,它只是一個比喻,就是和人腦的工作方式有類似之處,其實到今天為止我們的科學也不知道人腦是怎么工作的,我們只是知道人腦有神經(jīng)元,尤其是最近幾年算法的發(fā)展都是計算機科學在搞,從來沒有借鑒人腦科學的成果,這是一個很大的誤解。

過去有好多對人工智能分類,有弱人工智能,強人工智能,超人工智能。弱人工智能就是現(xiàn)在的情況,強人工智能就是電腦和人腦的能力是一樣的,超人工智能是電腦要超越人腦,我認為要達到強人工智能,也就是說電腦達到人腦的能力還有很長很長的時間,我不知道多長時間,也許幾十年,也許幾百年,也許永遠達不到,所以這方面我覺得大家不用太擔心。

有時候我拿它和原子彈相比,原子彈在發(fā)明之前,人類隔個幾十年就要有大的戰(zhàn)爭,原子彈發(fā)明之后可能所有人都覺得人類的末日就快要到了,但一直到今天都沒有發(fā)生大的戰(zhàn)爭,也許因為原子彈的誕生人類再也不會有大的戰(zhàn)爭,因為這樣的戰(zhàn)爭會毀滅掉所有的人,大家還是知道如何來控制的,所以人類對于人工智能技術(shù)的這種探索、開發(fā)、演進我也是非常樂觀的認為它帶來的影響主要是正面的影響,負面的影響完全是可控的。

過去這一年,雖然只是一年的時間,像去年我也來了貴陽數(shù)博會,雖然只有一年的時間,但是人工智能的技術(shù)卻是發(fā)生了非常大的變化或者說進步非常明顯。

語音識別過去這一年它的進步就很明顯,今天我們要進行搜索的話,比如你和朋友進行聊天,他說了一些詞或者說了什么事情你不是很清楚,你甚至不知道他說的那個詞是哪幾個字,沒有關(guān)系你用語音去搜索,它會知道你說的是哪幾個字,按照我們的評測,人類對于搜索詞的聽力、識別能力大概只有82%的正確率,機器達到86%、87%的正確率,過去這一年語音識別準確率已經(jīng)有了飛速的提升。

圖象識別其實也是一樣的,今天大家不管是在公園里面或者是辦公室里面看到什么植物,你想知道它叫什么,你拍張照片立刻就能識別出來這個植物的名字,過去你用文字描述不出來一棵陰性樹長什么樣子,圖象很好的能被計算機所理解,準確率過去一年也有很大的提升。人臉識別過去一年準確率非常高,一年前大數(shù)據(jù)人臉識別場景是一對一的,比如金融場景里面你要開一個會,你把身份證遞交給他,或者你提交你的身份證號碼,讓你遠程拍一個照片來驗證一下你是不是你,今天的人臉技術(shù)可以搞清楚你是誰,你不用事先告訴他說我叫李彥宏,他拍一下就能知道你是誰。所以現(xiàn)在變成1對N的識別,這是最近一年有比較大的進步。

今天百度不是刷工卡進入門禁,而是刷臉進入門禁,幾萬人的場景它立刻可以認出來你是誰。最近還有一個兩個傳播比較廣的例子,就是尋人的例子,其中有一個是重慶的孩子,他在5歲左右的時候走失,后來可能被拐賣到了福建,經(jīng)過了27年之后,我們再來比對他小時候的照片和他現(xiàn)在的照片,發(fā)現(xiàn)他確實是同一個人。當時在重慶走失的時候,記錄他的生日和后來他身份證上登記的生日是不一樣的,姓名是不一樣的,走失時間也都是不一樣的,但是用圖象識別技術(shù)可以識別出來他就是這個人。

更接近的一個例子是有一對老夫婦帶著他的智障孩子去北京治病結(jié)果孩子走丟了,因為是智障說不出來自己叫什么,說不出來家里在什么地方,老夫婦在北京待了八個月一直在找他的孩子,最近也是通過人臉識別技術(shù)順利找到了這個孩子,找到的時候他走失八個月,胡子拉碴,一般靠人臉識別很難識別出來他是走失的孩子。

過去我們覺得搜索場景可以使用自然語言,未來其他電器都可以進行自然語言交流,過去人發(fā)明工具之后都要重新學習一遍如何使用工具,未來不需要使用工具。我們最近在電視里面植入了 DuerOS 操作系統(tǒng),它就可以聽懂人話,現(xiàn)在看浙江衛(wèi)視說切換到江蘇衛(wèi)視它就給你切換了,你看電視你說這個演員叫什么,它馬上告訴你這個演員叫劉濤。

當然,這些提升其實和今天的主題“大數(shù)據(jù)”也是非常有關(guān)系的,之所以技術(shù)進步這么快,它就是依賴過去積累的大量的有價值的數(shù)據(jù),再加上計算資源越來越豐富,計算成本越來越低,所以過去我們認為不可能的技術(shù)現(xiàn)在變得可能了。

當然了,就是說數(shù)據(jù)和技術(shù),或者和算法到底是什么關(guān)系?其實也有各種各樣的討論,前一段時間我跟我們的一個工程師在討論的時候,他給我說了一句話,他說數(shù)據(jù)秒殺一切算法,就是你有了最好的數(shù)據(jù)的話,多好的算法都打不過人。是不是這樣呢?我覺得這個數(shù)據(jù)確實重要,沒有數(shù)據(jù)訓練的話人工智能走不到今天的,但是數(shù)據(jù)是不是根本呢?數(shù)據(jù)不是根本,數(shù)據(jù)有點像新時代的能源,像燃料,那么推動時代進步的是技術(shù),是創(chuàng)新,不是這些資源。

我經(jīng)常講人工智能這一次革命是堪比工業(yè)革命的那一次革命,我們回想一下工業(yè)革命當時最標志性的東西是什么呢?是蒸汽機,不是煤,當然最早的蒸汽機就是誕生在煤礦,最早的蒸汽機是挖煤的時候有很多滲水,把滲水從礦井下面提上去,蒸汽機在煤礦發(fā)明的當時一開始它非常效率低下,就是因為不缺能源,所以沒有關(guān)系,效率低下一點可以,但是我們絕大多數(shù)人不知道蒸汽機是誰發(fā)明的,你們知道瓦特,瓦特是在蒸汽機發(fā)明九十年以后才發(fā)明了比較高效的蒸汽機。

所以工業(yè)時代最寶貴的東西不是煤,是蒸汽機這樣的技術(shù)革命、革新,而人工智能時代最寶貴的也不是數(shù)據(jù),是因為數(shù)據(jù)帶來的技術(shù)的創(chuàng)新。而且過去一年就有這么多的創(chuàng)新,有大幅度的提升,連我在這個領域的人都要覺得要改變心態(tài),適應這種環(huán)境,適應各種各樣的可能性。所以我們有時候就想,這個技術(shù)很多時候是指數(shù)的在增長,今天上午的時候也提到了摩爾定律,就是技術(shù)能力,計算能力是在指數(shù)增長的,可是人的思維方式大多數(shù)時候是在線性增長的,你看它現(xiàn)在是這個樣子,它未來可能只是比現(xiàn)在好一點點

但其實不是的,一旦量積累到一定地步的時候,它會產(chǎn)生一些質(zhì)的變化,是常人很難適應甚至無法想象的一個變化。比如說傳說當中有一個過往為了獎勵國際象棋的發(fā)明人,他說我很喜歡國際象棋,我想給你一個獎勵,你要什么?這個發(fā)明人說,沒有關(guān)系,我就要點麥子,你能不能在象棋的格里面第一個格子放一粒,第二格放兩粒,第三格放四粒,這個看起來很少,但是全世界的麥子都放不滿這個想起格子。

所以最近我在講我們?yōu)槭裁匆囵B(yǎng)AI思維,這樣的思維方式不是我們習慣的思維方式,技術(shù)革命帶來不斷的可能性,我們需要極早為未來的這種可能性做準備。今天像貴陽在大數(shù)據(jù)領域的名聲已經(jīng)樹立起來了,已經(jīng)占有了這種先機,但是怎么樣把真正的數(shù)據(jù)資源變成創(chuàng)新能力,我覺得這是我們貴州或者貴陽需要認真思考的一個問題,過去的創(chuàng)新來源于實驗室,來源于大學,而未來的創(chuàng)新,我覺得來源于數(shù)據(jù),來源于場景,我們更好地把這些數(shù)據(jù)組織起來,把這些場景吃透,遇到問題解決問題,就產(chǎn)生了創(chuàng)新,這樣的創(chuàng)新又會不斷地培養(yǎng)我們的思維方式,跟得上未來科技的進步。

所以,我也是想借這個機會跟大家交流一下這方面的看法,希望貴陽能夠未來不僅抓住大數(shù)據(jù)的機會,也抓住人工智能時代各種各樣創(chuàng)新的機會。謝謝。

責任編輯:lihui