>
需要爬虫所有网页,需要检索全部内容……需要的算力太多了,就导致服务器的压力太大,搜索速度太慢。
还有一点,内容也不够精准。
谁说关键词出现的次数越多,内容就越好?
真正的好文章,可能是全文都没有“旅游”二字,但处处都是围绕着“旅游”的点点滴滴。却因为算法的不足,缺乏关键字,无法被用户搜索到。
周浩然的搜索思想,就跟他这段时间的交流会里一直表达的“科技民主化”的提议很相符。
采用的是投票制。
谁获得的投票多,谁的网站就排名靠前!
投票的策略,就是反向链接。
一个旅游内容的网页,会链接接到另一个网页;另一个旅游内容的网页,可能也会链接到相同的网页……
这个超链接,就是投票!
要是100个旅游相关的网页,都同时连接到了同一个旅游主页。
那就说明这个旅游主页获得了100个网页的认可,获得了100票!
一个旅游网页,被许许多多的旅游相关的网页都链接了,都关联上了,就充分说明这个旅游网页获得了业内同行的认可!
价值含量极高!
这就是投票制。
靠着投票,来把所有网页内容进行排列,按照票数的多少来排名先后,推荐给用户。
内容质量就大大提升了。
用超链检索取代全文检索,需要的算力也会大幅度减少,搜索速
本章未完,请点击下一页继续阅读! 第7页 / 共8页