APP不再是信息孤島 谷歌宣布抓取300億APP頁面

2015/04/17 10:07     

搜索引擎是內(nèi)容門戶之后的互聯(lián)網(wǎng)第二次重大技術(shù)革命。然而伴隨著智能手機的普及,應(yīng)用軟件(APP)取代網(wǎng)頁,成為主流的技術(shù)。由于APP的內(nèi)容一度無法被搜索引擎抓取到,人們驚呼,移動互聯(lián)網(wǎng)將帶來一場搜索引擎的生存危機。

不過,通過和應(yīng)用軟件開發(fā)商的合作,谷歌(微博)已經(jīng)一定程度上化解了這場危機。日前,谷歌已經(jīng)宣布,先后抓取了海量APP的300多頁的頁面內(nèi)容。手機端搜索的信息量,也將更加豐富。

谷歌搜索團隊在4月16日的一篇官方博文中,宣布了這一消息。

谷歌一名工程師帕特爾(RajanPatel)對媒體披露,從兩年前,谷歌開始對外部App的內(nèi)部鏈接和內(nèi)容進行抓取,目前已經(jīng)累計抓取了300多億個。

在傳統(tǒng)的WEB網(wǎng)頁中,谷歌可以通過軟件“蜘蛛”進行自動訪問和抓取,無需獲得網(wǎng)站管理員的許可。而在App內(nèi)容的抓取中,谷歌需要和應(yīng)用軟件開發(fā)商建立合作。谷歌提供了相應(yīng)的軟件開發(fā)接口(API),開發(fā)者通過這些接口,可以對谷歌搜索開放數(shù)據(jù),從而實現(xiàn)搜索引擎的內(nèi)容抓取。

據(jù)悉,已經(jīng)有大量的手機端軟件已經(jīng)和谷歌合作,其中包括微型博客Twitter、短期租房工具Airbnb、消費者點評工具Yelp、手機訂餐工具OpenTable、圖片收藏工社交網(wǎng)絡(luò)Pinterest、房地產(chǎn)搜索工具Trulia等等。

當(dāng)然還有大量的手機端媒體APP,也已經(jīng)被谷歌抓取新聞報道。

300多億個鏈接的內(nèi)容,和谷歌抓取的網(wǎng)頁數(shù)據(jù)庫相比,還只是小巫見大巫。之前的報道稱,谷歌蜘蛛抓取的網(wǎng)頁,數(shù)量高達數(shù)百億張。

不過在智能手機時代,人們使用搜索的目的性更強、具備更多的場景信息,因此主流的APP以及300多億個鏈接,已經(jīng)足夠提供用戶所需要的信息。

據(jù)報道,在此前的手機端搜索中,谷歌客戶端將會觀察用戶的智能手機中,都已經(jīng)安裝了哪些App,谷歌將只會返回已安裝APP的搜索結(jié)果內(nèi)容。

日前,谷歌團隊也宣布,對搜索結(jié)果中囊括的APP進行了修改,即使用戶沒有安裝某一個APP,其內(nèi)容只要相關(guān),也會出現(xiàn)在搜索結(jié)果中。

舉例說,如果用戶手機中沒有安裝訂餐工具OpenTable,但是在搜索某一家餐館時,谷歌仍然可能呈現(xiàn)來自O(shè)penTable的消費者評論信息。

不過對于谷歌而言,能夠抓取海量APP的內(nèi)容,并不意味著已經(jīng)徹底遠離了“搜索危機”。

有觀點認為,在智能手機端,手機族希望能夠最快速獲得最精準(zhǔn)的搜索結(jié)果,因此各種專業(yè)的APP,逐步取代了傳統(tǒng)網(wǎng)頁搜索的地位。比如人們可能在一個熱門的團購APP中搜索本地餐館和電影,而不是在谷歌輸入關(guān)鍵詞,然后看到浩如煙海的網(wǎng)頁結(jié)果。

手機端搜索消費行為的變遷,也給谷歌的發(fā)展前景蒙上了一層陰影。谷歌九成的收入來自于搜索結(jié)果右側(cè)的搜索廣告,如果人們遠離了電腦、遠離了傳統(tǒng)搜索引擎,谷歌將成為一家沒有實質(zhì)性替代收入的很危險的公司。

相關(guān)閱讀