2009年1月12日星期一

不同位置的网页优化

网站首页优化:
1. 关键词选择
首页的关键词应该选择核心关键词。通常这些词优化难度比较大,需要大量的外部链接。交换链接的时候以网站名称或者核心关键词命名链接。
2. 网页链接
首页大部分都是链接,最新的链接要放在网页的前面,便于搜索引擎收录。
3. 更新频率
蜘蛛第一个来到的页面就是首页,首页一定要经常更新,蜘蛛就会来的比较频繁,链接的页面将会更快被收录。

栏目页优化:
1. 关键词选择
栏目页的关键词,相对首页,可以选择次一些的关键词。
2. 内部链接
栏目页一定要链接到首页,为首页建立内部链接。同时和其他栏目页也要相互链接。栏目页大量的链接内容页,链接数量控制在 100 个以内。

内页优化:
1. 关键词
内页可以不特别关注关键词,可以将 Meta Title 设置成相同的内容。在页面里更多的利用H1,IMG、STRONG 标签优化关键词。
2. 内容
网页要以内容为主,大于5K 时,可以做翻页处理。内容最好是原创,内页收录的越多,从搜索引擎来的流量才能越多。
3. 链接
通常内页很少有外部链接的,除非内容非常好,被人转载。内页要链接栏目页和首页,大量的内页链接,有利于栏目页和首页的关键词排名。内页最好能链接内容相关的其他内页,这样可以增加网页的相关度,同时方便用户浏览,增加网站的PV。

Robots.txt
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件 robots.txt,在这个文件中声明该网站中不想被robot 访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt 文件应该放在网站根目录下。

网页相似度
1. 根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页有很高的相似性
2. 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5 值一样,证明这些网页有很高的相似性。

Google 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中。

404 页面
相关服务器返回代码介绍:
200 客户端请求已成功响应。
301 永久重定向某个链接。
302 临时重定向到某个链接。
404 访问的页面暂时不存在。

正确定义 404 错误页面:
1. 对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS 中定义404 错误指向一个动态页面,在页面里面使用301 跳转到新的地址,此时服务器返回301 状态码。
2. 当访问一个错误的链接时,将调用404 页面,但由于在IIS 里面设置的不同将导致返回不同的状态码:
a. 404 指向的是一个htm 文件,此时页面返回的404 状态码,这是正确的。
b. 404 指向的是一个URL,如果不在页面里面进行设置,仅仅是返回提示的HTML 代码,将导致页面返回200 状态码,此时的危害在于,当很多页面找不到时,都返回和访问正常页面时返回一样的200 状态码,将使搜索引擎认为该链接存在,并以错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降低。处理方法:在显示完提示内容后,增加语句: Response.Status="404 Not Found" ,这样就保证页面返回404 状态码。
3. 避免在调用 404 页面的时候返回302 状态码,容易被搜索引擎认为是重定向作弊。
4. 检测方法,使用 HttpWatch 查看返回代码。

没有评论: