多线程并发检索系统的构建也是一个壁垒,这部分不是公司找几个人就可以完成的,一个成型的分布式计算系统也不是短期内能够做到的。
事实上,技术只是技术,所有的搜索引擎是需要运营才能体现的。即便拥有了搜索引擎全方位的技术,要做出真正适用的可以商用的搜索引擎也还是需要不断的修正。
搜索引擎的现状
搜索引擎已经开始取代很多门户网站在网民心目中的位置,这同它们不断扩充的服务项目有关。比如百度和中搜网推出的新闻系统,他们可以更快的集成各种新闻,而且可以不用任何一名编辑。在这个新闻系统创建的过程中,尽管使用了搜索引擎的部分技术,但实际上同全网搜索服务是分离开的,因为新闻技术要求的实时性非常高,而全网搜索无法满足这种需要,因此,搜索引擎的新闻聚合技术主要考虑了快速和编辑功能。而Google已经成熟的新闻邮件定制功能也获得了很多用户的喜爱。
搜索引擎甚至开始涉及很多门户最火热的论坛,百度推出的“贴吧”就是一个例证。在百度创始人李彦宏看来,既然用户寻找同一个关键词,那说明他们关注的事情属于同一类,在搜索引擎无法提供满意的结果同时,人和人之间的交流或许可以带来更好的结果。不过从运行的结果看,除了“美女”和一些人们喜欢发表评论的关键词外,好像并不能给用户的搜索带来更多更好的效果。而Google斥重金收购最大的Blog系统Blogger.com也是因为看到了Blog的私人空间可能给搜索带来的巨大意义。
而MP3下载、Flash搜索这样的功能对于吸引网民更为实用。百度推出的MP3搜索就非常成功,百度技术副总裁刘建国说:“用户经常在网上寻找音乐资源,因此在2002年执行的闪电计划中,我们开发了mp3搜索功能,推出后,用户反响很大,迅速就把口碑建立了起来,这对百度的品牌和流量是非常有帮助的。”有位原来做过搜索引擎技术的程序员说:“我非常看好利用全网搜索技术做的多媒体形式的搜索功能。”事实上,虽然MP3的搜索与网页搜索在技术上差别并不大,但仍然需要考虑一些死链和下载速度的评估,有时还要考虑音乐格式。刘建国说:“我们甚至需要辨别原唱和翻唱的差别。”
由于搜索引擎试图进入更多领域-并且很多功能都在进行测试中,有些专家相信,未来的几年,尤其是在商业领域和个人学习领域,搜索引擎技术将会得到更为广泛的应用。另外一些专家则认为,搜索引擎技术的无限制扩展并不一定能够取得预想的成功,因为每一个专业领域都需要更加定制化的技术,意图以一种通用的技术统治整个信息产业是不现实的。
搜索引擎技术的近期展望
事实上,全网搜索引擎技术产生的突破性变化并不多。在搜索引擎的发展上,大的转变一般被认为有三次:第一次就是根据关键词在正文中出现的次数进行排序;第二次是Google的Pagerank技术带来的思想创新,这也是百度所提出的“超链分析”技术,核心思想是一个网页被其他网站引用的次数越多,这个网页的重要性就越强。当然,之后衡量PageRank的权重因素增加了很多种。第三次是伴随着商业收费模式诞生的“自信心”原则,指的是如果商家愿意为一个关键词付费时,那说明这个网站的价值也比较高,也应该放在前面。客观上来说,最后一次改变更像是搜索引擎公司为了收费而杜撰的理由,技术性的因素很小。