中小企业网络营销-能猫企业网络营销顾问,专业提供企业网络营销策略分析、网络营销策划等企业营销服务。

您现在的位置是:首页 - seo优化 - 正文

向量空间模型与搜索引擎相关度计算关系

    向量空间模型,又名VSM(Vector Space Models)是使用较为广泛的一种文档与查询词相关度计算方式。VSM是将查询词和文档根据关键词分别向量化,然后计算这两个向量数据之间的夹角余弦值,可得到文档和查询词的相关度。向量空间模型简单说来,就是将查询用词词如“能猫网络营销”用技术手段将其向量化,并找到数据库中已经被向量化的文档数据,并计算两个数据之间的夹角余弦。

    如果某网页文档出现查询词的次数较多,那么文档在计算时和这个原始查询词相关的几率就会很大。这一点也能解释为:如果整个网页文档的关键词都是一个关键词,所以按理来说该页面和原始查询词的夹角余弦可达到最大,这网页文档的排序就会十分靠前。

    如果某网页文档出现查询词的次数较多,那么文档在计算时和这个原始查询词相关的几率就会很大。这一点也能解释为:如果整个网页文档的关键词都是一个关键词,所以按理来说该页面和原始查询词的夹角余弦可达到最大,这网页文档的排序就会十分靠前。当然,现在搜索引擎的反SPAM机制十分完善,这种做法或许会导致搜索引擎根本不抓取这个页面。

    若是现在搜索引擎数据库中的所有数据,包含原始查询词的关键词的文档只有一个网页,那么在搜索时该网页出现的几率和排名靠前的几率就是最大的。因为只有一个页面有原始查询词的文字内容出现,所以这网页文档的权重最高,排名也是最靠前。可以看出,一个查询词的权重和它出现在这个网页中的次数成正比,和出现在这个查询词的网页数量成反比。

    其实如果对向量空间模型(Vector Space Models)了解的不是很透彻的话,可以把向量空间模型看做为搜索引擎计算中的相关度,其实相关度在搜索引擎的排序中有着十分重要的作用。网页与原始查询词的相关度越高,网页在搜索引擎中的排序就越靠前。

    搜索引擎在进行工作的时候,首先会将每一个网页的文档内容以多维空间和数字的形式表现出来,并将这些数据保存到数据库当中。当用户在进行某关键词的搜索时,搜索引擎首先会查询这个关键词的向量数据,接着会将这个数据与已经存在于搜索引擎数据库中的数据进行对比,将相关度依着好坏的顺序排列出来。

    当用户在百度的搜索框内输入原始查询词时,百度的算法系统首先会将这个关键词进行数据化处理,然后将得出的数据与库中预先保存好的网页文档进行对比,后再将合适的结果按照相关度从高到低的顺序进行排序,并展现在用户面前。

    假如现在搜索引擎数据库中的所有数据,包含“能猫网络营销”这个关键字的文档只有一个网页,那么在我们搜索该网页的几率和排名将是最大的,因为只有这么一个网页有“能猫网络营销”这样的关键字出现,所以该网页的相关度最大,权重也最高,排名也最靠前。
 

能猫网络营销-企业网络营销顾问SEO技巧分析,阿东希望您能常来。

标签:向量空间模型VSM搜索引擎相关度
分类:seo优化| 发布:阿东| 查看: | 发表时间:2011/8/3
原创文章如转载,请注明:转载自能猫生活记录 http://www.wlyxe.cn/
本文链接:http://www.wlyxe.cn/seo/vsm.html

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

网络营销

|

网络营销推广

|

网络营销策划

|

网络营销外包

|

企业网络营销

|

网络营销方案

|

网络品牌营销

|

网站运营策划

|

SEO优化

|

中小企业网络营销

|
关于本站 | 联系我们 | 广告服务 | 信息投稿 | 网站地图 | 免责声明 | 申请友链 | 收藏本站
Powered By Z-Blog 1.8 | Login | | Theme By www.wlyxe.cn