搜索引擎工作原理

UPTATED:2014-05-07 | 分类:网络知识

中山网络公司,中山网络制作爱途科技公司2014-05-07日报

    搜索引擎是一个非常复杂的数据库系统,通过抓取上亿级别的页面,建立索引数据库,组件庞大的数据库。当用户输入搜索关键词的时候,给予搜索结果的响应,这里我们只是简单的解析搜索引擎工作的步骤,仅供大家参考。


    搜索引擎工作大致分为三个流程:爬行抓取、预处理、排名

    (1)爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。  

    1.蜘蛛 

    2.跟踪链接
    3.吸引蜘蛛
    4.地址库
    5.文件存储
    6.爬行时的复制内容检测


    (2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。  

    1.提取文字

    2.中文分词
    3.去停止词
    4.消除噪声
    5.去重
    6.正向索引
    7.倒排索引
    8.链接关系计算
    9.特殊文件处理


    (3)排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后安一定的格式生成搜索结果页面。

    1.搜索词处理

    2.文件匹配
    3.初始子集的选择
    4.相关性计算
    5.排名过滤及调整
    6.排名显示
    7.搜索缓存
    8.查询及点击日志


本文来源中山网站建设https://www.zsitw.com/,引用或者转载请注明。多谢~
  • 2021-05-09 中山公司网站建设需要注意哪些问题?

    网站建设对于互联网公司来说,可谓是重中之重了!针对每一公司来说,网站建设不但有益于公司的管理,更有利于促进公司的品牌推广,达到宣传目的。 网站建设有哪些具体步骤? 1.先做好网站定位 先将公司做好一个准确的定位,想好需要做的是什么类型的公司网站,对网站的主要内容和主题有明显的确定。最好做个公司业务市场的调...

  • 2017-12-29 评估一家电商网站,用户体验的10个检查点

    本文可被看作是评估一家电商网站体验的10个检查点,这10点不仅侧重于可用性,更强调成功和失败的电商网站在哪些方面有区别,这意味着这些区别能直接影响转化、激活以及用户的参与度。     1.网站的易发现性     我们的顾客是通过互联网发现我们的吗?他们是在网上发现我们的...

  • 2017-04-01 响应式网站如何设计

    响应式网站使得不同设备、分辨率的网站都有最好的视觉体验。为了获得更好的效果,那么响应式网站如何设计才能表现出更好的效果呢?     一、网站设计     首先,生活常用亮色可以被柔和色反衬出来,这是非常明显是事情,在网页设计中也一样,你可以利于这一点去吸引观众眼...

  • 2016-10-06 网站排版美化

     seo是什么,seo就是优化网站美化网站。注重用户体验而来,一个网站质量好,美观。自然用户体验也就好,转化率也就高!首先我们需要把自己的站内优化好。站内优化也就是网站美化、排版,其次就是站内代码优化和内容优化了!   在日常上网中,我们上网打开一个排版乱七八糟的网站相信你也会马上关闭不想多看!这个就说明了...

  • 2016-09-02 官网搭建必须注意的三点

       网络营销的崛起带动了一大批人投入进来,都纷纷为自己的企业打造站点,想通过自己的网赚钱,然而对于新朋友而言,做好官网搭建往往是需要注意很多问题的,要是问我做网站的前期选择重不重要,这个我可以很肯定的回答:重要,非常的重要。我们应该走好站长的第一步,有了好的第一步,然后才会有第二步,第三步...