網(wǎng)絡(luò)時代的流感疫情預(yù)測

2009-05-08 03:27:15      貝小戎

  貝小戎

  5月2日,我在昆明機場候機,隨手撿了一本別人遺留下來的People雜志翻了翻。一位同伴說:“你也不怕甲型H1N1流感?”因為他這一問,回家后我上網(wǎng)搜索了一下甲型H1N1流感的傳播途徑。也許我這一搜還為疫情預(yù)測作了貢獻。5月3日,《紐約時報》的一篇報道說,上周,“甲型H1N1流感”取代“美國偶像”,成為Yahoo上最熱門的搜索關(guān)鍵詞。維基百科上“甲型H1N1流感”的頁面在周三和周四的訪問量達130萬。Twitter上每天提到甲型H1N1流感的更新估計有125000條,占總量的1%。Facebook上有一幅美國地圖,展示用戶在自我介紹頁面上提到“甲型H1N1流感”的頻率,提到“甲型H1N1流感”的用戶所在的州被用深藍色加以標(biāo)注。網(wǎng)絡(luò)提供了一條前所未有的途徑,供我們了解人們關(guān)心什么。

  跟用網(wǎng)絡(luò)搜索頻率預(yù)測“美國偶像”的比賽結(jié)果不同,預(yù)測季節(jié)性流感什么時候達到高峰(通常是在11月到次年4月之間)能夠拯救很多人的生命,當(dāng)局可以據(jù)此計劃接種疫苗的時間、增加醫(yī)院的人手和有序地提供治療措施。

  艾奧瓦州大學(xué)副教授菲利普·博格林研究了雅虎的搜索數(shù)據(jù)能否用來預(yù)測流感的暴發(fā)。2月的《自然》雜志上有一篇文章,金斯伯格和他的五位共同作者描述了兩組信息,一組是五年內(nèi)政府記錄的病人報告流感癥狀的頻率,一組是谷歌的搜索數(shù)據(jù),然后試著找出兩組信息的重疊之處,以此來判斷人們搜索最好的體溫計和離家最近的急診室是否意味著更多有流感癥狀的人去醫(yī)院就診。

  這種關(guān)聯(lián)必須反復(fù)出現(xiàn)。如果結(jié)果表明在流感暴發(fā)前,人們對速凍樹莓有一種神秘的食欲,谷歌的流感趨勢報告就會把這種研究添加至算法中。

  過去,流感監(jiān)測是觀察藥房里感冒藥的銷量何時達到最高。傳統(tǒng)的和網(wǎng)絡(luò)時代疫情監(jiān)測共同面臨的挑戰(zhàn)是要忽略掉“雜音”,集中于真正有意義的現(xiàn)象。傳統(tǒng)監(jiān)測中的雜音,比如感冒藥打折優(yōu)惠銷售,導(dǎo)致銷量陡增,這跟人們的健康狀況無關(guān)。而在網(wǎng)上,雜音無處不在。所以,如果想通過分析Twitter來預(yù)測流感何時暴發(fā),就不能搜索甲型H1N1流感一詞,應(yīng)該搜索相關(guān)癥狀。但Twitter確實提供了一種獨一無二的途徑。人們更有可能在Twitter上說自己感到不舒服,而不是說去看醫(yī)生。人們在社交網(wǎng)站上非常坦誠,所以對公共衛(wèi)生機構(gòu)來說是一種重要的工具。

  十年來,網(wǎng)絡(luò)使衛(wèi)生機構(gòu)能夠更早地監(jiān)測到病毒的出現(xiàn):地方公共衛(wèi)生機構(gòu)把報告貼到網(wǎng)上,隨后關(guān)鍵詞掃描程序能夠收集到這些數(shù)據(jù)。美國西北大學(xué)復(fù)雜系統(tǒng)研究所的一個計算機模型通過跟蹤美元的流通預(yù)測流感疫情。截至5月3日,根據(jù)這個模型的預(yù)測,到月底美國只會出現(xiàn)2000例感染,大部分在紐約、洛杉磯、邁阿密和休斯敦。該模型的預(yù)測結(jié)果跟疾病控制中心的統(tǒng)計數(shù)據(jù)大致吻合,計算機模型預(yù)測的是150至170例,疾控中心確認(rèn)的是226例。

  這個計算機模型依據(jù)的是一個名叫“喬治在哪里?”的網(wǎng)站中的數(shù)據(jù)。這個網(wǎng)站是程序員漢斯·艾斯金十多年前建的,他在他拿到的每張美鈔上請求下一個拿到這張美鈔的人去這個網(wǎng)站輸入其序列號,并留下郵政編碼。他只是想看看美鈔流通有多快、能流通到多遠(yuǎn)的地方。到2006年,這個網(wǎng)站已經(jīng)記錄了1億美元美鈔的流通情況。

  從德國訪問這個網(wǎng)站的布洛克曼博士無意間聽說了這個網(wǎng)站,意識到這正是他需要的東西:一個面對面交易的地圖,跟流感的傳播類似。

  印第安納大學(xué)的計算機模型依據(jù)的是全美的航空和公共交通網(wǎng)絡(luò)。它跟西北大學(xué)的計算機模型有一些類似的假設(shè),比如,每個感染者會傳染給1.7至2.8人。布洛克曼說平均數(shù)不能說明多少問題,可能一名學(xué)生會傳染給15名同學(xué),但在有的學(xué)校傳染率只有0.1,這就好比把比爾·蓋茨放在埃塞俄比亞,然后說該國的人均收入非常高。但有一件事是確定的:“人們對大數(shù)有著奇怪的感知。如果一個3億人的國家有2000人感染了病毒,大部分人會認(rèn)為他們將成為這2000人之一,而不是余下的299998000人中的一個?!?/p>

相關(guān)閱讀