中小企业网络营销-能猫企业网络营销顾问,专业提供企业网络营销策略分析、网络营销策划等企业营销服务。

您现在的位置是:首页 - seo优化 - 正文

什么是搜索引擎蜘蛛(spider)?

        如果把互联网比喻成一个蜘蛛网,那么spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
        搜索引擎蜘蛛(spider)在网站上采集内容的过程是,当一个未加载任何数据的空spider顺着互联网上的URL来到某个网站时,一般会按照如下流程进行工作:
        (1)检查网页是不是有过更新。这个过程中spider会把网页的内容和服务器上的快照内容进行对比,如果不同,就抓取新的网页内容,将其带到搜索引擎的数据库,并更新原来的网页快照。
        (2)如果是新网页,蜘蛛不但要抓取该网页的内容,还要将网页的URL带到搜索引擎的数据库。
        (3)经过数据处理,将蜘蛛带回的数据建立新的网页索引,并按照与关键词的相关度排序。

        当然,实际的搜索引擎工作过程是十分复杂的,包括数据挖掘、网页文件抓取、倒排索引、中文分词、分类和聚类、TF-IDF修改、信噪比计算、内容消重和反SPAM机制等一系列的工作。
 

标签:spider搜索引擎蜘蛛
分类:seo优化| 发布:阿东| 查看: | 发表时间:2011/2/14
原创文章如转载,请注明:转载自能猫生活记录 http://www.wlyxe.cn/
本文链接:http://www.wlyxe.cn/seo/38.html

相关文章

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

网络营销

|

网络营销推广

|

网络营销策划

|

网络营销外包

|

企业网络营销

|

网络营销方案

|

网络品牌营销

|

网站运营策划

|

SEO优化

|

中小企业网络营销

|
关于本站 | 联系我们 | 广告服务 | 信息投稿 | 网站地图 | 免责声明 | 申请友链 | 收藏本站
Powered By Z-Blog 1.8 | Login | | Theme By www.wlyxe.cn