很多美國大學都有類似計畫,他們的目的是解決網際網路搜索的爆炸性增長,以及該領域出現的其它複雜問題。
伯克利分校曾培養出了搜索方面的先驅人物Inktomi ,而且Google的CEO Eric Schmidt也是在這裡獲得計算機科學博士學位。
據研究中心主任Robert Wilensky 介紹,現在他們已經集結了大約20名各學科的教師,共同研究搜索技術。研究主要集中在這樣幾個方面:個人隱私,欺詐行為,多媒體搜索和個性化。
Wilensky是伯克利的計算機科學和信息管理系的教授,他說:" 我們要解決的問題正是搜索取得成功之後所產生的。" 儘管研究中心的大樓還在圖紙上,但是Wilensky說幾個月內就會完成建築設計,明年初中心就會開放。他還跟Google等搜索公司談了合作事宜。
他說:" 如果有20名對搜索感興趣的研究人員,那麼讓他們一起工作,交流想法,取得的成就會遠大於每個人單獨成就之和。這就像引發核反應。" Google拒絕對此發表評論。
搜索廣告每年的業務額高達50億美元,引起了各方面對網路研究和開發的興趣。這項業務不光為雅虎和Google這樣的巨頭每年帶來數十億美元的收入,還吸引了數以百計的網路新貴投身搜索領域。
要尋找下一代技術?最好去大學裡看看,眼下最成功的搜索公司就是從大學發跡的。
風險資本家Geoff Yang說:" 大學是新思想的一個主要來源"。在斯坦福大學,有兩對研究生相隔六年,幾乎是在同一間宿舍裡,分別創建了雅虎和Google。
Lycos 也曾是搜索技術的領導者,它脫胎於卡內基梅隆大學(CMU)。該學校的Raul Valdes - Perez 教授還研究出了一種集群搜索工具----Vivisimo。
今天的搜索問題跟五年前已是大不相同。現在網路上不光有書籍、論文,還有數字化的電視節目,這就要求搜索技術比以前更加優秀。人們希望找到可以信賴的信息,希望搜索工具可以對更加複雜的問題進行搜索。
CMU 的語言技術學會主席Jaime Carbonell 說,他的研究小組正在研究一種個性化搜索技術,這將有助於解決一些隱私問題,比如大規模蒐集姓名和查詢歷史等敏感數據。
CMU 的項目跟雅虎及Google已經測試的軟體有相同的功能,不過後兩者利用各自的網路蒐集和存儲搜索歷史,而CMU 開發了一種插件程序,人們可以下載到PC中使用。用戶可以維護和修改個性化的信息,比如查詢歷史、偏好和喜愛的網站等,並記錄到一個文件中。
經過專門設計的搜索引擎會查詢這個文件,並結合用戶的檢索項,對每次的搜索結果做出取捨,這樣個人信息就保留在用戶的電腦中,不會流失到網上。
Carbonell 透露,這種技術一年內就會問世,CMU 可能會把它作為開源軟體免費發行,也可能向公司授權使用。
CMU 還在進行一項由政府資助的長期項目,它的代號為" 標槍" ,旨在研究問答式搜索技術。對於詞語定義或者「洛杉磯的人口是多少」 之類的百科知識,Google、MSN 、Ask Jeeves等公司已經可以作出快捷的回答。
但是對於更複雜的查詢,比如「從舊金山到倫敦最便宜的航班是哪個?」或者「哪個大學的計算機科學系最大?」目前還很難搜索到有效的答案。
Carbonell 說:" 這是個動態的信息,你必須分析問題,在多個地方找到答案,然後進行比較。這需要許多步驟。我們研究如何把它化為一步,並且把中間過程提交給用戶。" 他認為,要想達到政府以及網路用戶期望的功能和效率,可能還需要四五年的時間。
得克薩斯大學和賓夕法尼亞大學也在研究類似的問題。
斯坦福繼續扮演著搜索技術孵化基地的角色。自從2003年以來,Google已經從斯坦福購買了至少兩項研究成果----其中一個是個性化搜索工具Kaltix,另一項成果則出自斯坦福計算機科學系的合作研究機構。
斯坦福的副教授Andrew Ng 致力於人工智慧技術的研究,他希望從檢索索引中提取出信息。
還有一些人憑藉研究項目創辦了新公司。searchfox 就是這樣的網路公司,它由斯坦福教授James Gibbons 和前任工程學院院長共同創建。這傢俬人持股的公司發明瞭一種聯合搜索引擎,可以讓用戶分享喜歡的鏈接,創建個性化的搜索索引。
斯坦福大學、麻省理工學院和其他的許多大學都在著手解決未來的圖書館面臨的問題----大規模的數字化。篩選和組織數以億計的數字化文件,需要新的搜索技術支持。
麻省理工學院已經跟萬維網協會合作開展一項代號為Simile的計畫,研究使用" 語義" 網路的下一代搜索技術。
一名參與該計畫的MIT 研究生開發了一款叫做Piggybank 的工具軟體,可以嵌入到Firefox 瀏覽器中。利用Piggybank ,人們在瀏覽網頁的時候可以用關鍵字進行標記,創建一個經過註釋的本地收藏夾,併發表到一個叫做"the bank"的網站。
這樣,它就變成了一個" 語義瀏覽器" ,用戶可以更好的理解網頁上的信息。
在一次演示中,Piggybank 整合了從電影站點Boston.com和Google maps 獲得的資料,得出了飯店和電影院附近的咖啡店分布圖。用戶還可以把這些信息保存到一個資料庫檔案中(不僅僅是書籤),以後就可以根據它的屬性或者指定關鍵字進行搜索。
麻省理工學院準備向師生們推廣這些先進的技術。
在伯克利的研究中心,Wilensky開展了一項雄心勃勃的計畫----他要解決" 大" 搜索面臨的問題。大搜索指的是分析和組織各種形式的信息(包括圖像、視頻和電子商務信息),幫助人們合成這些信息並從中提取情報。
一個主要的應用領域將是可信度和隱私。比如,你從Google上搜索的內容由多大的可信度?如何判斷一名eBay賣家是否值得信賴?
Wilensky說他的團隊研究證明,eBay賣家的信用評價受報復性評價的影響,從而發生偏移。有不良記錄的用戶會換一個名字再次出現,變成沒有任何記錄。
Wilensky說,因此他的團隊開發了一種叫做"EM trust"的演算法,它採用了一種評估在線賣家誠實度的統計模式。這項成果有可能用於網站。
伯克利無線技術研究中心也準備開展相關研究,而且它還有大型的移動公司作為後盾。它將吸納伯克利電機系的教授Jitendra Malik,以及計算機科學系的教授David Forsyth ,這兩者都從事計算機視覺研究。
(文章僅代表作者個人立場和觀點) --版權所有,任何形式轉載需看中國授權許可。
- 關鍵字搜索:
- 誰會
看完那這篇文章覺得
排序