李彥宏早年頂級(jí)論文曝光 治學(xué)創(chuàng)業(yè)其道一也

2012/10/23 18:16     

  中新網(wǎng)10月23日電 近日,一份百度創(chuàng)始人李彥宏早年間發(fā)表于國(guó)際權(quán)威學(xué)術(shù)期刊PAMI的論文在國(guó)內(nèi)計(jì)算機(jī)工程師中悄然流傳。據(jù)本報(bào)記者調(diào)查顯示,這篇1996年發(fā)表的論文主要聚焦于OCR(光學(xué)字識(shí)別)模型選擇和集成問題,成文于1993年李彥宏就讀研究生期間。

  IEEE PAMI,全稱“IEEE Transactions on Pattern Analysis and Machine Intelligence”,世界計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域頂尖期刊。在PAMI上發(fā)表論文至今仍被作為博士后選拔的衡量指標(biāo)。李彥宏能以碩士研究生身份完成這樣“不可能的任務(wù)”,讓已經(jīng)習(xí)慣了他企業(yè)家身份的人們感到驚訝。

  1993年5月,當(dāng)時(shí)還在布法羅大學(xué)念研究生的李彥宏進(jìn)入位于普林斯頓的松下信息技術(shù)研究所兼職實(shí)習(xí),期間他涉及了OCR并革新了算法,獲得了研究所的重視,8月底,當(dāng)李彥宏結(jié)束兼職回校時(shí),松下決定破例繼續(xù)聘用他,并允許他無需上班,可以在學(xué)校里做研究。后來的一次國(guó)際性學(xué)術(shù)會(huì)議上,李彥宏發(fā)布了這個(gè)研究成果,并在PAMI上發(fā)表這篇題為《光學(xué)字符識(shí)別圖像缺陷的驗(yàn)證》的論文。

  1994年,李彥宏放棄博士入學(xué)資格,進(jìn)入道瓊斯公司旗下IDD信息服務(wù)部門的加里軟件公司工作,并在美國(guó)電氣與電子工程師學(xué)會(huì)的期刊上發(fā)表了名為《關(guān)于定性搜索引擎》的論文,也是在這時(shí),李彥宏發(fā)現(xiàn)“科學(xué)論文通過索引被引用次數(shù)的多寡來確定一篇論文的好壞,超鏈就是對(duì)頁(yè)面的引用。”李彥宏回憶,“超鏈上的文字就是對(duì)所鏈接網(wǎng)頁(yè)的描述,通過這個(gè)描述可以計(jì)算出超鏈和頁(yè)面之間的相關(guān)度?!币源藶榛A(chǔ),1997年2月李彥宏正式向美國(guó)商標(biāo)局申請(qǐng)了“超鏈分析技術(shù)”專利(Hypertext document retrieval system and method,專利號(hào)5,920,859)。這也為他后來放棄美國(guó)綠卡、回國(guó)創(chuàng)業(yè),建成全球第一大中文搜索引擎——百度奠定了技術(shù)基礎(chǔ)。

  1998年,第七屆萬維網(wǎng)大會(huì)在澳大利亞布里斯班舉行,當(dāng)時(shí)年僅30歲的李彥宏作為美國(guó)最知名的搜索引擎公司之一——Infoseek 的技術(shù)專家應(yīng)邀在大會(huì)做了題為“How to find spam in web search”的演講,而聽眾席上就坐著后來Google的兩位創(chuàng)始人——當(dāng)時(shí)仍在斯坦福就讀的佩奇和布林。二人還在會(huì)議間歇向李彥宏請(qǐng)教搜素引擎如何實(shí)現(xiàn)商用化的問題。不久之后,Google在美國(guó)誕生。而戲劇性的是,佩奇在申請(qǐng)專利時(shí)由于Page rank與李彥宏之前申請(qǐng)的超鏈分析專利具有相似性,美國(guó)專利商標(biāo)局直到2001年才獲準(zhǔn)了 Page Rank專利申請(qǐng)。這一段軼事,也因?yàn)镚oogle傳記《in the plex》一書的披露而為越來越多的人所了解。

  十年后,當(dāng)萬維網(wǎng)之父提姆•博納斯•李在與李彥宏在第十七屆萬維網(wǎng)大會(huì)相遇,他告訴李彥宏,自己至今對(duì)他在第七屆大會(huì)上的演講印象深刻。而在2011年世界計(jì)算機(jī)大會(huì)上,原美國(guó)國(guó)家科學(xué)基金會(huì)副主席兼信息學(xué)部主任彼得·弗里曼發(fā)布的“計(jì)算機(jī)發(fā)展史”報(bào)告中,李彥宏成為唯一提及的中國(guó)學(xué)者,與發(fā)明了TCP協(xié)議的羅伯特·卡恩以及開創(chuàng)了智能手機(jī)和平板電腦新時(shí)代的喬布斯等齊名。在他們心目中,李彥宏除了是百度的引領(lǐng)者之外,更是對(duì)業(yè)界產(chǎn)生深遠(yuǎn)影響的技術(shù)專家。

  今年9月份,李彥宏應(yīng)邀出席數(shù)據(jù)挖掘領(lǐng)域頂級(jí)年會(huì)——第18屆ACM SIGKDD大會(huì)并發(fā)表演講。時(shí)隔多年,他仍將OCR 作為“互聯(lián)網(wǎng)行業(yè)的九大難題”之首,又讓人們仿佛看到了那個(gè)在松下實(shí)驗(yàn)室里一鳴驚人的年輕中國(guó)學(xué)生,十多年來依舊保持著對(duì)技術(shù)的熱愛和創(chuàng)新的敏銳。

相關(guān)閱讀