一、超链接分析算法
Google的PR系统
PR的全称PageRank.中文解释为网页级别。
用什么办法可以提高自己的google PR?
增加高质量导入链接,导入链接质量越高,此页面评分就越高,反之亦然.
Google进行网页排序需要考虑什么?
不仅仅是PR,还有链接页面本身的年龄,链接页面内容的更新频率,甚至用户通过搜索引擎点击到网页的次数等很多项。
使用什么办法逐步提高PR?
①与高质量的网站建立友情链接或者导入链接。
②对网站内容勤加更新,内容最好是自己原创且保证大部分文章是高质量,有价值的。
③将自己的网址提交到DMOZ等开放目录。
影响PR的因素有哪些? (来自百度百科)
一般情况下,PR的更新周期为2.5-3个月。
(1)与PR高的网站做链接。
(2)内容质量高的网站链接。
(3)加入搜索引擎分类目录。
(4)加入免费开源目录
(5)你的链接出现在流量大.知名度高.频繁更新的重要网站上
(6)Google对PIF格式的文件比较看重
(7)安装Google工具条
(8)域名和Uhe标题出现关键词与META标签等
(9)反向链接数量和反向链接的等级
(10)Google抓取您网站的页面数量
(I1)导出链接数量
二、百度的超级链接分析系统
百度的超链接分析系统是百度创始人李彦宏在1996年发明的,并获得专利。
搜索引擎三大定律:
第一定律:相关性定律
第二定律:人气质量定律 质量高、人气旺、超链接分析
第三定律:自信心定律 竞价拍卖
1、相关度计算在SEO中的作用
2、向量空间模型
向量空间模型,又名VSM(Vector Space Models)是使用广泛的一种文档与查阅词相关度计算方式。
计算两个数据之间的夹角余弦:
理论上该页面和原始查询词的余角余弦可以达到最大,网页文档的排序也就非常靠前了。但是这样做可能会导致搜素引擎对该页面不予抓取。
3、中文分词的重要性
一个页面关键词不要超过3个,如果超过了会分散每个关键词的权重。例如:“上海进口轴承销售,广州进口轴承销售”,我们可以改为“<title>进口轴承销售-上海-广州<./title>”,这样的虽然没有上面的直接,但是分词的办法可以使很多词语都获得不错的效果。时间长了广州+进口轴承销售,上海+进口轴承销售。的相关性会使进口轴承销售这个关键词相关度很高。所以排名也会很快提高。
①基于最大匹配的分词方式
最早的是北京航空大学的梁南元教授提出的。在20世纪80年代哈尔滨工业大学计算机博士王晓龙博士提出了”最少词数”的分词理论。
②基于统计模型的分词远离
从形式上看,词是稳定的字的组合,因此在上下文中,相邻的字出现的次数越多,就越有可能构成一个词。因此字与字之间相邻共现的频率能够较好反映成词的可信度。
“瑞星\一直\以\质量\和服\务\开拓\安全\市场。” 这样分词是错误的。正向最大匹配法。
“瑞星\一直\以\质量\和\服务\开拓\安全\市场。” 逆向最大匹配法。
我
4、新词的处理方法
网络文化发展速度快,新词诞生,搜索引擎为了应对,处理方法如下:
化靰牛是一种食草动物
一般来说,搜索引擎遇到这样的关键词,会采用一元分词+二元分词+不分词的方式解决。
一元分词:化\靰\牛是\一种\食草\动物\ 或者 化\靰\牛\是\一种\食\草\动物\
二元分词: 化靰\靰牛\是\一种\食草\动物\
干脆不分:化靰\靰牛\化靰牛\是\一种\食草\食\草\动物\食\草\动物\
5、利用中文分词进行常委关键词操作
利用中文分词技术,我们可以让自己的网页拥有更多的长尾关键词。