什么叫做百度搜索引擎优化? 我们要了解两个概念,第一百度搜索引擎,第二优化。
百度搜索引擎工作原理: 百度“派出”蜘蛛(spider)对网络上的网站进行爬行,蜘蛛将爬行到的网站进行抓取,将处理过的页面放到百度数据库(存储),进行预处理,再对页面进行索引,当用户进行百度搜索时,百度根据用户发出的信息(即用户搜索的关键词)对数据库中相关的网站进行匹配,最后将与关键词相关的网站进行排序,展现给用户。 名词解释: 蜘蛛:百度搜索引擎发出的机器人,用来对大量的页面进行抓取。 预处理:蜘蛛将提取到的文字进行中文分词,去重,去停止词,去出噪声。 中文分词:对提取到的文字分成一个个有意义的词语。 去重:去掉与数据库中重复的内容 去停止词:去除啊.额.的.地...这些停止词 去除噪声:去除不相关的内容或者链接 索引:利用的是倒排索引
倒排索引结构 利用关键词对应文件的形式,将用户搜索的关键词在数据库中进行查找文件,不同的关键词对应多个不同的文件,搜索引擎对文件进行相关度和权重计算,将搜索结果展现给用户。 |