现在的位置: 首页 > SEO技术 > 正文

百度搜索引擎原理和基础算法

2017年03月05日 SEO技术 ⁄ 共 818字 ⁄ 字号 暂无评论

一、什么是搜索引擎 搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。

二、搜索引擎原理 在搜索引擎的后台,有一些用于搜集互联网网页信息的程序,俗称“蜘蛛”或“爬虫”,它从互联网中几千万到几十亿的网页中查找,对网页中的每一个词(即关键词)进行索引,在经过复杂的算法(或者包含商业化的竞价排名、商业推广、或者广告)后,把符合要求的网页按照与搜索关键词的相关度高低(或与相关度毫无关系)依次排序,并建立索引数据库。

 

  图:搜索引擎原理

三、搜索引擎基础算法 目前全球使用最广泛的是GOOGLE,最大的中文搜索引擎是百度。由于GOOGLE退出了中国市场,我们常用的有百度、360好搜、搜狐搜狗、腾讯搜搜等搜索引擎。

以百度搜索引擎为例对基础算法进行介绍。

百度算法是由李彦宏1997年在美国申请的专利“超级链接分析技术”为基础,经过不断的发展与完善。

2013年2月19日上线了绿萝算法,是为了打击买卖链接的行为,包括超链中介、出卖链接的网站、购买链接的网站;

2013年5月17日上线了石榴算法,打击大量妨碍用户正常浏览的恶劣广告的页面;

2013年7月1日上线上绿萝算法2.0,加大力度打击过滤软文中的外链及惩罚发软文的站点;

2014年8月30日上线上冰桶算法,打击强行弹窗app下载、大面积广告等影响用户正常浏览体验的页面;

2014年11月18日上线了冰桶算法2.0,打击全屏下载、在狭小的手机页面布设大面积广告遮挡主体内容、强制用户登录的行为;

2016年7月15日上线了冰桶3.0,打击用户在搜索引擎下浏览结果被强行送入某APP的现象;

2016年9月19日上线了冰桶4.0,打击移动负面广告过多,影响用户体验的现象。

2016年11月上线了蓝天算法,打击新闻源站点售卖软文、目录等严重违反新闻源规则,并影响用户搜索体验行为。

百度不断的完善算法规则的目的:千方百计提高用户体验。

给我留言

留言无头像?