如何讓搜索引擎擁有“生命”?

2014/08/19 10:38     

在許多人看來搜索引擎只是一個檢索工具,就像其他冷冰冰的科技產(chǎn)品一樣。實際上,搜索引擎正在成為人人依賴的智能助手。它在擁有感知環(huán)境和自我學(xué)習(xí)的能力后,隨著歲月流逝將不斷地將信息轉(zhuǎn)化為知識,再將知識沉淀為智慧,被賦予“生命”價值。

Online Learning ,讓搜索引擎“活起來”

Online Learning(在線學(xué)習(xí))便是讓搜索引擎“活起來”的關(guān)鍵技術(shù),它讓搜索引擎擁有更強大的學(xué)習(xí)能力進而越來越聰明。

理論上來說,一個用戶使用搜索引擎越多,搜索引擎就愈發(fā)了解這個用戶和整體熱度變化,推薦精準(zhǔn)度會越來越高。根據(jù)用戶特征不斷調(diào)整算法提高準(zhǔn)確度就是學(xué)習(xí)過程。在Online Learning技術(shù)之前,搜索引擎的學(xué)習(xí)是離線完成的,定時進行數(shù)據(jù)模型和排序及推薦算法的更新,但不會做到在用戶每一次反饋之后都更新算法。Online Learning則讓“學(xué)習(xí)”更加具有時效性,粒度細(xì)化到每個用戶。它可以隨時根據(jù)用戶的下載、點擊、停留時間、鼠標(biāo)移動這些行為去理解用戶進而動態(tài)調(diào)整排序和推薦算法,給用戶想要的。

在技術(shù)上Online Learning只需要對當(dāng)前用戶相關(guān)的數(shù)據(jù)進行計算即可,增量學(xué)習(xí)的方式節(jié)省了計算資源同時增強了時效性,因為它可以一邊學(xué)習(xí)一邊預(yù)測、推薦和排序,這可以做到對推薦的動態(tài)調(diào)整進而確保推薦效果。

在這種快速迭代的基礎(chǔ)上,Online Learning能夠采取比離線預(yù)測更為靈活的策略,如Bandit策略,它能夠降低信息的冗余,緩解馬太效應(yīng),給了資源更多更平等的機會,可以說形成一種“百花齊放”的狀態(tài),在短時間內(nèi)迅速定位優(yōu)質(zhì)資源。

Online Learning 或?qū)⒂瓉泶笠?guī)模應(yīng)用

在百度的搜索引擎結(jié)果中,右側(cè)知心中,App助手推薦,多媒體搜索結(jié)果中,在線學(xué)習(xí)系統(tǒng)已被大規(guī)模應(yīng)用,相關(guān)測試表明Online Learning可大幅提升推薦點擊率和用戶滿意度?,F(xiàn)在你搜索“雙層床”右側(cè)不會只出現(xiàn)相關(guān)結(jié)果,而是根據(jù)之前用戶搜索類似關(guān)鍵詞后的反饋,推薦了小戶型裝修等服務(wù)。

Online Learning即在線機器學(xué)習(xí),目前業(yè)界只有百度進行了大規(guī)模的商業(yè)化應(yīng)用。Yahoo和Google進行了一些嘗試,但集中在實驗、調(diào)研或者論文層面。Online Leaning技術(shù)與百度正在深耕的深度學(xué)習(xí)、百度大腦以及大數(shù)據(jù)業(yè)務(wù)有著千絲萬縷的聯(lián)系,接下來必將得到更大的提升和應(yīng)用機會,據(jù)說百度已經(jīng)在為與之相關(guān)的技術(shù)已經(jīng)在申請專利。

好比一個兒童在早期說法、寫字、走路都需要有大人刻意訓(xùn)練一樣,這時候它并無“在線學(xué)習(xí)”能力,而是“監(jiān)督學(xué)習(xí)”;到了一定階段它可以根據(jù)環(huán)境反饋和個人經(jīng)驗自己掌握一些技能,譬如在不斷跌倒和騎行過程中自學(xué)自行車,下水喝了幾次水之后自然習(xí)得游泳技術(shù),這時候就是“在線學(xué)習(xí)”模式??梢哉f,人腦本身就是一個基于反饋在線學(xué)習(xí)的系統(tǒng),Online-learning就是人腦接收環(huán)境和外界對于人的“反饋”,以使得人不斷調(diào)整自己行為的過程,這種學(xué)習(xí)機制是人類不斷自我進步和自我發(fā)展的源動力。

Online Learning 讓搜索引擎擁有生命

今年李彥宏曾對外透露“百度大腦”的智力水平已接近3歲嬰兒,我們尚不知道這個項目究竟做了什么看得見的東西,沒有科技媒體能夠走進這個項目深入了解它。百度對此介紹只有寥寥數(shù)字:利用計算機技術(shù)模擬人腦。百度大腦還出現(xiàn)在了百度推出的世界首個大數(shù)據(jù)引擎中,百度大腦發(fā)揮的作用就是讓大數(shù)據(jù)引擎能夠在數(shù)據(jù)挖掘的基礎(chǔ)上,形成“如何挖掘數(shù)據(jù)”的學(xué)習(xí)能力。

現(xiàn)在看來所有技術(shù)都是互聯(lián)互通的,百度大腦與Online Learning相似之處都是讓搜索引擎“活起來”,擁有學(xué)習(xí)能力和智力水平,最終越來越聰明。

近年來越來越多科技巨頭開始關(guān)注科技與人類和諧共處的問題,蘋果讓科技與人文和藝術(shù)更加緊密的結(jié)合,可穿戴設(shè)備讓科技穿戴或植入人體隱秘存在,Nest則讓科技具有感知環(huán)境和自我學(xué)習(xí)能力,百度則是讓搜索引擎愈發(fā)聰明,理解人,與人自然對話。未來所有這些科技都會融為一體:手機、智能硬件、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)服務(wù),無處不在的科技最終讓人們感受不到科技的存在,科技與世界已經(jīng)渾然一體,水乳相融。

作者微博@互聯(lián)網(wǎng)阿超,微信SuperSofter

相關(guān)閱讀