Ash Patel:大數(shù)據(jù)的四個(gè)趨勢(shì)

2013/12/13 11:27     

Morado Ventures是由雅虎前高管阿什·帕特爾(Ash Patel)注資發(fā)起的早期的天使基金。在“”2013云世界大會(huì)“上,Ash Patel用他們投資過的企業(yè)案例,來解說大數(shù)據(jù)的四個(gè)趨勢(shì),以及你用數(shù)據(jù)可以做什么。

第一個(gè)趨勢(shì),實(shí)時(shí)的數(shù)據(jù)的分析。看一下全球的情況,有90億的設(shè)備是和互聯(lián)網(wǎng)相關(guān)的,到2020年會(huì)有150億的設(shè)備,包括手機(jī)、機(jī)器、感應(yīng)器。我們的數(shù)據(jù)量是不斷爆炸的,機(jī)器量會(huì)比人們?cè)瓉韼淼臄?shù)據(jù)大很多,這是一個(gè)大的趨勢(shì)。

舉一個(gè)例子,比如我這次坐的飛機(jī),每小時(shí)會(huì)帶來22T的數(shù)據(jù)。每天24小時(shí)生成的數(shù)據(jù)是非常巨大的,我們生活在這個(gè)世界當(dāng)中,每一分鐘都有不同的數(shù)據(jù)產(chǎn)生。數(shù)據(jù)在現(xiàn)階段是最有效的,所以在全球我們必須進(jìn)行實(shí)時(shí)的數(shù)據(jù)處理。不進(jìn)行數(shù)據(jù)處理,你都沒有辦法進(jìn)行很好的儲(chǔ)存,這就是我們?yōu)槭裁匆紤]對(duì)實(shí)時(shí)的數(shù)據(jù)進(jìn)行處理。

我們?cè)?jīng)投資過一家公司,叫做DATA TORRENT。Hadoop會(huì)處理你的數(shù)據(jù),每天每小時(shí)會(huì)發(fā)給你報(bào)告,告訴你數(shù)據(jù)的變化。對(duì)于DATA TORRENT也是這樣的,在Hadoop上可以利用這樣的架構(gòu),給你一個(gè)實(shí)時(shí)的可精簡(jiǎn)的流數(shù)據(jù)。你可能只有一個(gè)小的硬件,每小時(shí)、每分鐘你都可以處理很多的數(shù)據(jù),做一些可預(yù)測(cè)的分析。為什么這一點(diǎn)是非常重要的?因?yàn)槟憧梢赃M(jìn)行實(shí)時(shí)的數(shù)據(jù)的監(jiān)測(cè),也可以讓業(yè)務(wù)的狀態(tài)實(shí)時(shí)的來進(jìn)行更新。這就是我們所說的實(shí)時(shí)的平臺(tái),它的實(shí)時(shí)性是非常重要的。

現(xiàn)在很多反饋都可以生成數(shù)據(jù),像金融行業(yè)。金融詐騙發(fā)生的時(shí)候,你需要找到金融詐騙的渠道?;蛘咴谑豌@井的平臺(tái)上,你發(fā)現(xiàn)哪一口井的油壓發(fā)生的問題,這都是需要實(shí)時(shí)數(shù)據(jù)分析的。

圖像就是一個(gè)一個(gè)的節(jié)點(diǎn)聚在一起,放在一起數(shù)據(jù)量是非常大的。在Hadoog數(shù)據(jù)當(dāng)中,我們通過一定的形式來存儲(chǔ)數(shù)據(jù)?,F(xiàn)在全球的形勢(shì)是非常復(fù)雜的,社交網(wǎng)絡(luò)實(shí)際上就是圖表的一種。運(yùn)輸網(wǎng)絡(luò)、供應(yīng)鏈等等這些設(shè)備,一個(gè)機(jī)器是來自于全球幾千個(gè)部件組合在一起的,每一個(gè)企業(yè)都有自己的運(yùn)輸網(wǎng)絡(luò)。如果有一家企業(yè)出現(xiàn)了問題,或者他們的運(yùn)輸線,或者鐵路線出現(xiàn)了問題,你要對(duì)圖表進(jìn)行分析,測(cè)量它產(chǎn)生的影響。這是很難的,因?yàn)閷?duì)于圖表的分析,這也是大數(shù)據(jù)分析當(dāng)中很困難的一點(diǎn)。

這方面也有一個(gè)技術(shù),我們對(duì)其進(jìn)行了投資。充分的利用圖表當(dāng)中有效的數(shù)字進(jìn)行不斷的擴(kuò)展和升級(jí)。

為什么圖表的數(shù)據(jù)非常重要?比特幣最近炒的很熱。在銀行帳戶當(dāng)中里可以進(jìn)行資金的轉(zhuǎn)移,如果你想知道這個(gè)人是不是在“洗錢”。A把錢給了B,在金融的交易當(dāng)中,正常的銀行帳戶會(huì)有一個(gè)記錄,錢從賬戶A挪到了賬戶B。

但是現(xiàn)在有上百萬的金融數(shù)據(jù),你想追蹤,從A賬戶到B賬戶,你沒有數(shù)據(jù)庫就沒有辦法來做。對(duì)于客戶來說也有一些客戶的數(shù)據(jù),我們可以通過幾百萬的數(shù)據(jù)中來看A是不是給B發(fā)送了錢。所以對(duì)于金融行業(yè)來說這也是非常重要的。這就是我們所說的圖表的重要性。對(duì)于圖表型的數(shù)據(jù),你可以進(jìn)行分析,它不僅僅應(yīng)用在社交網(wǎng)絡(luò),還可以應(yīng)用在其他的領(lǐng)域,像基礎(chǔ)設(shè)施。

另外一個(gè)趨勢(shì),隨著人們大量的使用云計(jì)算,你有沒有能力管理。

人們已經(jīng)看到了這種變化,就像集裝箱把一個(gè)東西發(fā)送到另一個(gè)地點(diǎn)。在軟件的領(lǐng)域你沒有辦法很容易的把軟件像集裝箱一樣打包進(jìn)行轉(zhuǎn)移。但有一家企業(yè)docker他們可以讓人們將數(shù)據(jù)打包,應(yīng)用可以很容易的像集裝箱一樣打包。

現(xiàn)在在云上每個(gè)人都在用虛擬化,打包的方式變得更加的容易。可以把你的網(wǎng)絡(luò)流程進(jìn)行分類,不一定是只有虛擬化才能夠?qū)崿F(xiàn)。你有整個(gè)的操作體系,你有你的硬件,在這個(gè)基礎(chǔ)之上你有自己的瀏覽器,對(duì)于每一個(gè)應(yīng)用都要進(jìn)行收集,在此基礎(chǔ)之上進(jìn)行分析。這是很復(fù)雜的流程,docker公司可以將你的軟件進(jìn)行打包,放在集裝箱當(dāng)中,可以在同一個(gè)操作系統(tǒng)上部署。你可以更加的準(zhǔn)確應(yīng)用所有的應(yīng)用,我們可以通過虛擬化的方式獲得所有的收益。

這家公司有開源的軟件,google等其他的合作伙伴都在與他合作。docker未來可以做更多的事情,可以把整個(gè)流程打包,從開發(fā)生產(chǎn)到拓展實(shí)現(xiàn)一體化,以非常簡(jiǎn)單的方式就可以實(shí)現(xiàn)。

最后一個(gè)趨勢(shì),軟件定義數(shù)據(jù)中心。出現(xiàn)云之前,所有技術(shù)都是基于硬件基礎(chǔ)之上的,現(xiàn)在我們需要對(duì)架構(gòu)進(jìn)行重新的思考。老的數(shù)據(jù)中心有一些機(jī)器有比較低的平衡度,這是非常常見的數(shù)據(jù)中心的結(jié)構(gòu),發(fā)明了云之后,我們可以對(duì)硬件進(jìn)行應(yīng)用虛擬化,在云的環(huán)境當(dāng)中運(yùn)行??匆幌戮W(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)仍然是硬件,我們需要進(jìn)行串聯(lián),現(xiàn)在有辦法進(jìn)行一些改變。所以現(xiàn)在的計(jì)算是由軟件所定義的。

有一家公司PLURIBUS提供的設(shè)備可以對(duì)整個(gè)架構(gòu)進(jìn)行虛擬化,對(duì)路由等等都進(jìn)行虛擬化。隨著拓展,隨著加入新的客戶,你可以把整個(gè)網(wǎng)絡(luò)進(jìn)行重新的配置,在軟件上就可以實(shí)現(xiàn),不需要更大的變革。

相關(guān)閱讀