百度最近有三件事:發(fā)布財(cái)報(bào),員工漲薪,開放大數(shù)據(jù)引擎。
財(cái)報(bào)營收、凈利潤漲勢喜人;員工漲薪更有動力;百度的核心業(yè)務(wù)依舊是搜索,去哪兒愛奇藝的投資、移動互聯(lián)網(wǎng)、O2O等服務(wù)的點(diǎn)綴。表面看都只是量的疊加。但當(dāng)Robin為百度技術(shù)開放日首度站臺的時(shí)候,我們恍然發(fā)現(xiàn),百度,甚至整個(gè)互聯(lián)網(wǎng)已經(jīng)從量變走向質(zhì)變了。而質(zhì)變意味著可能再造一個(gè)百度。
質(zhì)變到來
正如Robin所說,很多年他在美國學(xué)人工智能的時(shí)候,發(fā)現(xiàn)沒什么實(shí)際的用處,都是些理論的東西,真正拿到實(shí)際的應(yīng)用當(dāng)中,可以運(yùn)用的東西非常少。
一直到前幾年很多人還是有這樣的觀念,但是最近幾年就完全不一樣了。技術(shù)積累到一定地步的時(shí)候,會發(fā)生從量變到質(zhì)變。量變過程中不會覺得它有多么significant,但當(dāng)發(fā)生質(zhì)變的時(shí)候就有可能被打得措手不及。
我們的意識里,都是互聯(lián)網(wǎng)改變了生活,卻感受不到技術(shù)對互聯(lián)網(wǎng)的改變。
中國互聯(lián)網(wǎng)發(fā)展了20年,到現(xiàn)在我們才清楚地看到,互聯(lián)網(wǎng)已經(jīng)逐漸顛覆了媒體、零售、旅游、金融,傳統(tǒng)行業(yè)這時(shí)候著急了。這都是拜技術(shù)所賜。如摩爾定律,每隔18個(gè)月計(jì)算機(jī)的計(jì)算能力會增加一倍,成本會降到一半。表面是一種量變,計(jì)算機(jī)計(jì)算能力越來越快、存儲成本越來越低。但連續(xù)幾十年發(fā)生之后,人工智能真的有用了、計(jì)算機(jī)也真的可以像人一樣開始思考了。
未來世界的本質(zhì)是數(shù)據(jù)流
中國互聯(lián)網(wǎng)發(fā)展了20年,從門戶、BBS、搜索、博客、SNS、電子商務(wù)、視頻、微博、微信,再到自媒體、互聯(lián)網(wǎng)金融、眾籌等等,完成了基礎(chǔ)設(shè)施和互聯(lián)網(wǎng)應(yīng)用的建設(shè)和普及。也可以說完成了信息流、物流、人流、資金流流動渠道的構(gòu)建。
下一個(gè)20年等待我們的是什么?露出苗頭的可穿戴設(shè)備告訴我們,上面的四個(gè)流都將匯聚成數(shù)據(jù)流,我們將迎來大數(shù)據(jù)時(shí)代。以媒體為例,都是在賣影響力,然而技術(shù)的變革,導(dǎo)致渠道的變化,渠道的變化導(dǎo)致客戶以及受眾的注意力轉(zhuǎn)移。所以,《競報(bào)》、《天天新報(bào)》等紙媒倒下了;網(wǎng)絡(luò)媒體也面臨著移動互聯(lián)網(wǎng)的沖擊,一直在賣影響力,很容易達(dá)到極限。一旦下一代技術(shù)帶來質(zhì)變,讀者走了、客戶跑了,可以想想門戶和新聞客戶端的關(guān)系。媒體形態(tài)的改變、內(nèi)容的生產(chǎn)方向,都將建立在數(shù)據(jù)基礎(chǔ)之上,被數(shù)據(jù)引導(dǎo)。
為什么是百度?
百度的大數(shù)據(jù)引擎由開放云、數(shù)據(jù)工廠和百度大腦三大組件組成,對大數(shù)據(jù)進(jìn)行收集、存儲、計(jì)算、挖掘和管理,并通過深度學(xué)習(xí)技術(shù)和數(shù)據(jù)建模技術(shù),使數(shù)據(jù)具有“智能”。
大數(shù)據(jù)引擎由開放云、數(shù)據(jù)工廠和百度大腦三大組件組成,對大數(shù)據(jù)進(jìn)行收集、存儲、計(jì)算、挖掘和管理,并通過深度學(xué)習(xí)技術(shù)和數(shù)據(jù)建模技術(shù),使數(shù)據(jù)具有“智能”。“百度開放云”是大數(shù)據(jù)引擎運(yùn)行的基礎(chǔ)構(gòu)件,通過分布各地的百度新一代高效能數(shù)據(jù)中心為傳統(tǒng)行業(yè)提供超大規(guī)模的數(shù)據(jù)存儲和分布式計(jì)算。在此基礎(chǔ)上,“數(shù)據(jù)工廠”對行業(yè)數(shù)據(jù)進(jìn)行一系列規(guī)范化處理,提供強(qiáng)大的數(shù)據(jù)管理和分析能力。
更上一層,則是百度人工智能的精華——“百度大腦(Baidu Brain)”,基于百度深度學(xué)習(xí)研究院的成果,融合深度學(xué)習(xí)算法、數(shù)據(jù)建模、大規(guī)模GPU并行化平臺等技術(shù),實(shí)現(xiàn)了無不不刻都在學(xué)習(xí)與成長,它擁有200億個(gè)參數(shù),構(gòu)造起深度神經(jīng)網(wǎng)絡(luò)。以此實(shí)現(xiàn)智能數(shù)據(jù)分析及預(yù)測功能,實(shí)現(xiàn)數(shù)據(jù)智能,支持科學(xué)決策與創(chuàng)造。
而與其它有大數(shù)據(jù)能力的企業(yè)相比,阿里的大數(shù)據(jù)是基于淘寶等平臺摸清消費(fèi)者習(xí)慣,應(yīng)用體現(xiàn)在數(shù)據(jù)魔方、聚石塔,同時(shí)也讓外部數(shù)據(jù)接到阿里云上來,這與百度模式相似。但阿里在語音、圖像等識別上技術(shù)欠缺,在人工智能上缺乏想象空間;騰訊與阿里類似,未能提供智能化的解決方案。
Google與百度思路一樣,提供的大數(shù)據(jù)分析智能應(yīng)用包括客戶情緒分析、交易風(fēng)險(xiǎn)(欺詐分析)、產(chǎn)品推薦、消息路由、診斷、客戶流失預(yù)測、法律文案分類、電子郵件內(nèi)容過濾、政治傾向預(yù)測、物種鑒定等多個(gè)方面,但還未考慮將大數(shù)據(jù)獨(dú)立共享。
能否再造一個(gè)百度?
越來越多機(jī)構(gòu)、企業(yè)都迫切希望從大數(shù)據(jù)中挖掘出有價(jià)值的趨勢洞察,但都普遍面臨著大數(shù)據(jù)應(yīng)用困境。數(shù)據(jù)孤島嚴(yán)重、數(shù)據(jù)存儲與管理、數(shù)據(jù)分析挖掘以及智能化能力也都存在著難以突破的瓶頸。
百度的開放大數(shù)據(jù)引擎,將是與搜索引擎并列、甚至比搜索引擎更具想象空間的平臺,構(gòu)建一個(gè)全新生態(tài)。解決傳統(tǒng)產(chǎn)業(yè)問題:管理、產(chǎn)品迭代、新商業(yè)模式等。百度已經(jīng)有了傳統(tǒng)企業(yè)客戶基礎(chǔ),在大數(shù)據(jù)引擎上收入也更加多元化,如CTR、服務(wù)升級、新模式(如金融知心)等。傳統(tǒng)行業(yè)市場空間巨大,大量行業(yè)的單行業(yè)產(chǎn)值都在萬億級以上。百度大數(shù)據(jù)核心能力的開放將成為行業(yè)轉(zhuǎn)型和模式創(chuàng)新的引擎,撬動萬億級產(chǎn)業(yè)升級的想象空間。
大數(shù)據(jù)未來應(yīng)用場景
城市旅游預(yù)測
哪些城市將被擠爆,哪里的人最愛去哪里,反映各旅游景點(diǎn)未來的人流趨勢。
Babycry
剛出生的寶寶的哭聲,家長不知道如何處理,父母可以將嬰兒的哭聲錄下來,在百度語音庫中對比,是餓了,還是哪里不舒服了,更直觀清晰的了解孩子為什么哭。
安保追逃
攝像頭信息記錄及分析,可以通過海量監(jiān)控視頻中通過圖像識別技術(shù)找出犯罪嫌疑人,解決社會問題。