薛奇苦思如何解决搜索准确性技术,一直没有想到太好的解决方法,这难住了他。
1996年4月,一场关于信息检索方面的学术会议在躁动不安的赌城拉斯韦加斯召开,会议枯燥乏味,让人昏昏欲睡,但对薛奇来说,却是一个难得的能让人静心思考的机会。他坐在台下,伴随着台上冗长的发言,思索搜索引擎怎样才能突破眼下的瓶颈,忽然,台上发言者以他的论文被引用的次数来验证自己的观点,薛奇脑中灵光蓦然闪现!
人们往往根据一篇论文被引用次数的多少来评价这篇论文是否权威,同理,如果应用到网页检索上,哪个网页被链接的次数最多,是否就可以认定哪个网页质量最高,人气最旺?如果再加上相应的链接文字分析,就可以应用到搜索结果的排序上了。
突如其来的思路让薛奇兴奋异常,他立即就这一理论进行论证并且整理成稿,于当年正式提出“超链分析”的概念并发表了相关文章。
1997年2月,他申请了专利—超链分析技术(Hypertext document retrieval system and method,专利号5920859)。超链分析技术的发明,一改互联网搜索杂乱无章、信息冗余的局面,使搜索效果大幅提升。薛奇给这个原理取了一个很人文的名字,叫人气质量定律,也叫搜索引擎的第二定律。此前利用检索词在一篇文章中出现的频率多少进行网页排序,被称为第一定律。
然而薛奇的专利技术在《华尔街日报》并没有得到充分的重视,作为一家媒体,他们的资源更倾向于编辑和记者。超链分析技术受到了冷落,没有展现应有的巨大价值。
后来在一次学术会议上,薛奇请时任Infoseek CTO的威廉•张观看超链分析的实践。薛奇输入chinatimes,排在第一位的就是中国时报的网站,再搜IBM,IBM官方网站排在第一,这在以后看来是非常正常的搜索排序在当时是想象不到的了不起的成就!
威廉•张惊呼:“太厉害了,任何一个流行的搜索引擎都不如你的搜索引擎智能!”
1997年,在《华尔街日报》看不到更大的发展空间的薛奇受到Infoseek CTO威廉•张的邀请,加盟硅谷Infoseek网络公司,Infoseek给薛奇的待遇是巨额的年薪和比年薪多几倍乃至十几倍的公司股票以及广阔的前景,并且让薛奇继续其在搜索引擎方面的研究。
现在的薛奇虽然在Infoseek网络公司不管是收入待遇还是受重视程度,比以前更进了一步,他现在已经算是步入美国富裕阶层的上流社会了,但和互联网大潮之中涌现的财富神话相比,还是相差甚远。他的超链分析技术和Hotmail、ICQ一样,都是互联网时代具有开创性的独家技术,但Hotmail和ICQ的发明者现在都已经是亿万富翁了,而他和他们相比,完全不在一个层次。
本章未完,请点击下一页继续阅读! 第2页/共5页