要看你想要的功能,以及排序结果要是开发一般的搜索引擎(比如google,baidu),要构建自己的爬虫,对服务器要求特别高要是开发元搜索引擎,就没有很高的硬件要求了。自己可以建立一个在各大搜索之上的虚拟数据库,这样,重点就在你的排序上面了不过排序可不太好整
搜索引擎——信息检索实践这本书不错,结合书在结合开源搜索引擎框架开始学习