在陆道升赴美的前一天,嘉盛的搜索引擎“寻知”上线了。</p>
自从启动了搜索引擎计划,陆道升的心理压力就没小过。</p>
双开需要勇气,特别是这个双开指的是作前世PC互联网时代三巨头中的两个。</p>
人的精力是有限的,陆道升对自己的管理水平也没自信到觉得能百分之百同时做好社交和搜索两大业务。</p>
基本上一直在如履薄冰,可以预期未来也还是这样。</p>
上线的那一刻,陆道升的感觉很奇妙,所有之前的辛苦在这一刻都值回票价了。</p>
呆坐在办公桌前,盯着眼前屏幕上简洁的求知搜索引擎页面,眼神在凝聚变幻,身形却如同被施展了定身咒一样,定定地杵在那里一动不动,连呼吸都屏住了。</p>
就好像害怕眼前的景象是一个梦的气泡,一用力会把气泡戳破。</p>
嘉盛QQ上线的时候也没见陆道升这样过……</p>
中国人需要一个好的搜索引擎来帮助国民获取信息和知识,而陆道升认为,百度根本是反其道而行。</p>
在互联网诞生之前,人们就知道了相关性的重要性。</p>
在情报检索(或信息检索)领域,学术界已经就这一问题充分讨论过。</p>
文本检索上,相关性基本上都是基于词频统计的,这一实践为早期的搜索引擎广泛采用。</p>
当用户输入检索词时,搜索引擎会去找那些检索词在文章(网页)中出现频率较高的,位置较重要的,再加上一些对检索词本身常用程度的加权,最后排出一个结果来。</p>
相关性即搜索引擎的第一定律。</p>
但进入互联网时代,由于谁都可以进行内容的发布,为了能够排在某些检索结果的前列,许多网页内容的制作者绞尽脑汁,在其页面上堆砌关键词,早期搜索引擎对此防不胜防,苦不堪言。</p>
也因此,随着不短的探索和尝试,出现了业界公认的搜索引擎第二定律,即相关性定律。</p>
类比科学论文的索引机制,哪篇论文被引用次数多,就被认为是权威高质量。</p>
放在互联网上,就是哪个网页被链接次数多,那个网页就被认为是质量高。</p>
这基于这一思想,李彦宏开发并申请了搜索引擎领域开创性的““超链分析技术”专利。</p>
受李彦宏的启发,谷歌创始人也设计出日后用于谷歌引擎的核心算法PageRank。</p>
只是搜索引擎并不是单纯的信息检索问题,而是包含了市场和企业经营的因素,做搜索引擎的人也是需要赚钱的。</p>
用李彦宏的话讲,那就是:“世事难料,2000年起网络泡沫迅速破灭,各大搜索引擎要么遭人收购,要么推迟上市,所有使用人气质量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路到底在哪儿?”</p>
于此,李彦宏提出了搜索引擎的第三定律,即自信心定律。</p>
在他自己发表的一篇博客中,李彦宏这样写道:“根据这一定律,搜索结果的相关性排序,除了词频统计和超链分析之外,更注重的是竞价拍卖。</p>
谁对自己的网站有信心,谁就排在前面。有信心的表现就是愿意为这个排名付钱。需要声明的是,自信心定律也是我自己给这一模式起的名字,以前的文献中并没有人这样总结过。”</p>
并且在文章的结尾写道:“在中国,百度一直致力于推动搜索引擎市场的培植和发展。</p>