网站优化
Mar
20
mpstat是MultiProcessor Statistics的缩写,是实时系统监控工具。其报告与CPU的一些统计信息,这些信息存放在/proc/stat文件中。在多CPUs系统里,其不但能查看所有CPU的平均状况信息,而且能够查看特定CPU的信息。下面只介绍mpstat与CPU相关的参数,mpstat的语法如下:
mpstat [-P {|ALL}] [internal [count]]
参数的含义如下:
参数 解释
-P {|ALL} 表示监控哪个CPU, cpu在[0,cpu个数-1]中取值
internal 相邻的两次采样的间隔时间
count 采样的次数,count只能和delay一起使用
当没有参数时,mpstat则显示系统启动以后所有信息的平均值。有interval时,第一行的信息自系统启动以来的平均信息。
从第二行开始,输出为前一个interval时间段的平均信息。与CPU有关的输出的含义如下:
参数 解释 从/proc/stat获得数据
CPU 处理器ID
user 在internal时间段里,用户态的CPU时间(%),不包含 nice值为负 进程 (usr/total)*100
nice 在internal时间段里,nice值为负进程的CPU时间(%) (nice/total)*100
system 在internal时间段里,核心时间(%) (system/total)*100
iowait 在internal时间段里,硬盘IO等待时间(%) (iowait/total)*100
irq 在internal时间段里,硬中断时间(%) (irq/total)*100
soft 在internal时间段里,软中断时间(%) (softirq/total)*100
idle 在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%)(idle/total)*100
intr/s 在internal时间段里,每秒CPU接收的中断的次数intr/total)*100
CPU总的工作时间=total_cur=user+system+nice+idle+iowait+irq+softirq
total_pre=pre_user+ pre_system+ pre_nice+ pre_idle+ pre_iowait+ pre_irq+ pre_softirq
user=user_cur – user_pre
total=total_cur-total_pre
其中_cur 表示当前值,_pre表示interval时间前的值。上表中的所有值可取到两位小数点。
范例1:average mode (粗略信息)
当mpstat不带参数时,输出为从系统启动以来的平均值。
CODE:
[work@builder linux-2.6.14]$ mpstat
Linux 2.6.9-5.31AXsmp (builder.redflag-linux.com) 12/16/2005
09:38:46 AM CPU %user %nice %system %iowait %irq %soft %idle intr/s
09:38:48 AM all 23.28 0.00 1.75 0.50 0.00 0.00 74.47 1018.59
范例2: 每2秒产生了2个处理器的统计数据报告
下面的命令可以每2秒产生了2个处理器的统计数据报告,一共产生三个interval 的信息,然后再给出这三个interval的平均信息。默认时,输出是按照CPU 号排序。第一个行给出了从系统引导以来的所有活跃数据。接下来每行对应一个处理器的活跃状态。。
CODE:
[root@server yum_dir]# mpstat -P ALL 2 3
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
09:34:20 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:22 PM all 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.49
09:34:22 PM 0 0.00 0.00 0.50 0.00 0.00 0.00 0.00 99.50 1001.00
09:34:22 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
09:34:22 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:24 PM all 0.00 0.00 0.25 0.00 0.00 0.00 0.00 99.75 1005.00
09:34:24 PM 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1005.50
09:34:24 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
09:34:24 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:26 PM all 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.49
09:34:26 PM 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.00
09:34:26 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
Average: CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
Average: all 0.00 0.00 0.08 0.00 0.00 0.00 0.00 99.92 1002.66
Average: 0 0.00 0.00 0.17 0.00 0.00 0.00 0.00 99.83 1002.49
Average: 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
[root@server yum_dir]#
范例3:比较带参数和不带参数的mpstat的结果。
在后台开一个2G的文件
# cat 1.img &
然后在另一个终端运行mpstat命令
CODE:
[root@server ~]# cat 1.img &
[1] 6934
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:31 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:31 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.40 1004.57
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:35 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:35 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.39 1004.73
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:39 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:39 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.38 1004.96
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:44 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:44 PM all 0.07 0.02 0.26 0.21 0.01 0.05 0.00 99.37 1005.20
[root@server ~]# mpstat 3 10
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:55 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:58 PM all 13.12 0.00 20.93 0.00 1.83 9.80 0.00 54.32 2488.08
10:18:01 PM all 10.82 0.00 19.30 0.83 1.83 9.32 0.00 57.90 2449.83
10:18:04 PM all 10.95 0.00 20.40 0.17 1.99 8.62 0.00 57.88 2384.05
10:18:07 PM all 10.47 0.00 18.11 0.00 1.50 8.47 0.00 61.46 2416.00
10:18:10 PM all 11.81 0.00 22.63 0.00 1.83 11.98 0.00 51.75 2210.60
10:18:13 PM all 6.31 0.00 10.80 0.00 1.00 5.32 0.00 76.58 1795.33
10:18:19 PM all 1.75 0.00 3.16 0.75 0.25 1.25 0.00 92.85 1245.18
10:18:22 PM all 11.94 0.00 19.07 0.00 1.99 8.29 0.00 58.71 2630.46
10:18:25 PM all 11.65 0.00 19.30 0.50 2.00 9.15 0.00 57.40 2673.91
10:18:28 PM all 11.44 0.00 21.06 0.33 1.99 10.61 0.00 54.56 2369.87
Average: all 9.27 0.00 16.18 0.30 1.50 7.64 0.00 65.11 2173.54
[root@server ~]#
上两表显示出当要正确反映系统的情况,需要正确使用命令的参数。vmstat 和iostat 也需要注意这一问题。
# cat 1.img &
然后在另一个终端运行mpstat命令
CODE:
[root@server ~]# cat 1.img &
[1] 6934
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:31 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:31 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.40 1004.57
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:35 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:35 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.39 1004.73
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:39 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:39 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.38 1004.96
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:44 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:44 PM all 0.07 0.02 0.26 0.21 0.01 0.05 0.00 99.37 1005.20
[root@server ~]# mpstat 3 10
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:55 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:58 PM all 13.12 0.00 20.93 0.00 1.83 9.80 0.00 54.32 2488.08
10:18:01 PM all 10.82 0.00 19.30 0.83 1.83 9.32 0.00 57.90 2449.83
10:18:04 PM all 10.95 0.00 20.40 0.17 1.99 8.62 0.00 57.88 2384.05
10:18:07 PM all 10.47 0.00 18.11 0.00 1.50 8.47 0.00 61.46 2416.00
10:18:10 PM all 11.81 0.00 22.63 0.00 1.83 11.98 0.00 51.75 2210.60
10:18:13 PM all 6.31 0.00 10.80 0.00 1.00 5.32 0.00 76.58 1795.33
10:18:19 PM all 1.75 0.00 3.16 0.75 0.25 1.25 0.00 92.85 1245.18
10:18:22 PM all 11.94 0.00 19.07 0.00 1.99 8.29 0.00 58.71 2630.46
10:18:25 PM all 11.65 0.00 19.30 0.50 2.00 9.15 0.00 57.40 2673.91
10:18:28 PM all 11.44 0.00 21.06 0.33 1.99 10.61 0.00 54.56 2369.87
Average: all 9.27 0.00 16.18 0.30 1.50 7.64 0.00 65.11 2173.54
[root@server ~]#
上两表显示出当要正确反映系统的情况,需要正确使用命令的参数。vmstat 和iostat 也需要注意这一问题。
mpstat [-P {|ALL}] [internal [count]]
参数的含义如下:
参数 解释
-P {|ALL} 表示监控哪个CPU, cpu在[0,cpu个数-1]中取值
internal 相邻的两次采样的间隔时间
count 采样的次数,count只能和delay一起使用
当没有参数时,mpstat则显示系统启动以后所有信息的平均值。有interval时,第一行的信息自系统启动以来的平均信息。
从第二行开始,输出为前一个interval时间段的平均信息。与CPU有关的输出的含义如下:
参数 解释 从/proc/stat获得数据
CPU 处理器ID
user 在internal时间段里,用户态的CPU时间(%),不包含 nice值为负 进程 (usr/total)*100
nice 在internal时间段里,nice值为负进程的CPU时间(%) (nice/total)*100
system 在internal时间段里,核心时间(%) (system/total)*100
iowait 在internal时间段里,硬盘IO等待时间(%) (iowait/total)*100
irq 在internal时间段里,硬中断时间(%) (irq/total)*100
soft 在internal时间段里,软中断时间(%) (softirq/total)*100
idle 在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%)(idle/total)*100
intr/s 在internal时间段里,每秒CPU接收的中断的次数intr/total)*100
CPU总的工作时间=total_cur=user+system+nice+idle+iowait+irq+softirq
total_pre=pre_user+ pre_system+ pre_nice+ pre_idle+ pre_iowait+ pre_irq+ pre_softirq
user=user_cur – user_pre
total=total_cur-total_pre
其中_cur 表示当前值,_pre表示interval时间前的值。上表中的所有值可取到两位小数点。
范例1:average mode (粗略信息)
当mpstat不带参数时,输出为从系统启动以来的平均值。
CODE:
[work@builder linux-2.6.14]$ mpstat
Linux 2.6.9-5.31AXsmp (builder.redflag-linux.com) 12/16/2005
09:38:46 AM CPU %user %nice %system %iowait %irq %soft %idle intr/s
09:38:48 AM all 23.28 0.00 1.75 0.50 0.00 0.00 74.47 1018.59
范例2: 每2秒产生了2个处理器的统计数据报告
下面的命令可以每2秒产生了2个处理器的统计数据报告,一共产生三个interval 的信息,然后再给出这三个interval的平均信息。默认时,输出是按照CPU 号排序。第一个行给出了从系统引导以来的所有活跃数据。接下来每行对应一个处理器的活跃状态。。
CODE:
[root@server yum_dir]# mpstat -P ALL 2 3
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
09:34:20 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:22 PM all 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.49
09:34:22 PM 0 0.00 0.00 0.50 0.00 0.00 0.00 0.00 99.50 1001.00
09:34:22 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
09:34:22 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:24 PM all 0.00 0.00 0.25 0.00 0.00 0.00 0.00 99.75 1005.00
09:34:24 PM 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1005.50
09:34:24 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
09:34:24 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
09:34:26 PM all 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.49
09:34:26 PM 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1001.00
09:34:26 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
Average: CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
Average: all 0.00 0.00 0.08 0.00 0.00 0.00 0.00 99.92 1002.66
Average: 0 0.00 0.00 0.17 0.00 0.00 0.00 0.00 99.83 1002.49
Average: 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00
[root@server yum_dir]#
范例3:比较带参数和不带参数的mpstat的结果。
在后台开一个2G的文件
# cat 1.img &
然后在另一个终端运行mpstat命令
CODE:
[root@server ~]# cat 1.img &
[1] 6934
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:31 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:31 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.40 1004.57
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:35 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:35 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.39 1004.73
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:39 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:39 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.38 1004.96
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:44 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:44 PM all 0.07 0.02 0.26 0.21 0.01 0.05 0.00 99.37 1005.20
[root@server ~]# mpstat 3 10
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:55 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:58 PM all 13.12 0.00 20.93 0.00 1.83 9.80 0.00 54.32 2488.08
10:18:01 PM all 10.82 0.00 19.30 0.83 1.83 9.32 0.00 57.90 2449.83
10:18:04 PM all 10.95 0.00 20.40 0.17 1.99 8.62 0.00 57.88 2384.05
10:18:07 PM all 10.47 0.00 18.11 0.00 1.50 8.47 0.00 61.46 2416.00
10:18:10 PM all 11.81 0.00 22.63 0.00 1.83 11.98 0.00 51.75 2210.60
10:18:13 PM all 6.31 0.00 10.80 0.00 1.00 5.32 0.00 76.58 1795.33
10:18:19 PM all 1.75 0.00 3.16 0.75 0.25 1.25 0.00 92.85 1245.18
10:18:22 PM all 11.94 0.00 19.07 0.00 1.99 8.29 0.00 58.71 2630.46
10:18:25 PM all 11.65 0.00 19.30 0.50 2.00 9.15 0.00 57.40 2673.91
10:18:28 PM all 11.44 0.00 21.06 0.33 1.99 10.61 0.00 54.56 2369.87
Average: all 9.27 0.00 16.18 0.30 1.50 7.64 0.00 65.11 2173.54
[root@server ~]#
上两表显示出当要正确反映系统的情况,需要正确使用命令的参数。vmstat 和iostat 也需要注意这一问题。
# cat 1.img &
然后在另一个终端运行mpstat命令
CODE:
[root@server ~]# cat 1.img &
[1] 6934
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:31 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:31 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.40 1004.57
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:35 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:35 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.39 1004.73
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:39 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:39 PM all 0.07 0.02 0.25 0.21 0.01 0.04 0.00 99.38 1004.96
[root@server ~]# mpstat
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:44 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:44 PM all 0.07 0.02 0.26 0.21 0.01 0.05 0.00 99.37 1005.20
[root@server ~]# mpstat 3 10
Linux 2.6.18-164.el5 (server.sys.com) 01/04/2010
10:17:55 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:17:58 PM all 13.12 0.00 20.93 0.00 1.83 9.80 0.00 54.32 2488.08
10:18:01 PM all 10.82 0.00 19.30 0.83 1.83 9.32 0.00 57.90 2449.83
10:18:04 PM all 10.95 0.00 20.40 0.17 1.99 8.62 0.00 57.88 2384.05
10:18:07 PM all 10.47 0.00 18.11 0.00 1.50 8.47 0.00 61.46 2416.00
10:18:10 PM all 11.81 0.00 22.63 0.00 1.83 11.98 0.00 51.75 2210.60
10:18:13 PM all 6.31 0.00 10.80 0.00 1.00 5.32 0.00 76.58 1795.33
10:18:19 PM all 1.75 0.00 3.16 0.75 0.25 1.25 0.00 92.85 1245.18
10:18:22 PM all 11.94 0.00 19.07 0.00 1.99 8.29 0.00 58.71 2630.46
10:18:25 PM all 11.65 0.00 19.30 0.50 2.00 9.15 0.00 57.40 2673.91
10:18:28 PM all 11.44 0.00 21.06 0.33 1.99 10.61 0.00 54.56 2369.87
Average: all 9.27 0.00 16.18 0.30 1.50 7.64 0.00 65.11 2173.54
[root@server ~]#
上两表显示出当要正确反映系统的情况,需要正确使用命令的参数。vmstat 和iostat 也需要注意这一问题。
Mar
8
1、基本类
http://top.baidu.com 百度搜索排行
http://index.baidu.com 百度指数
https://adwords.google.cn/select/KeywordToolExternal 谷歌关键词工具
http://www.google.cn/trends 谷歌搜索引擎趋势
http://sitemap.cn.yahoo.com Yahoo外部链接工具
http://siteexplorer.search.yahoo.com 网站分析(英文)
http://www.zhuici.com/ 关键词分析
http://www.pipiki.com/ 网站价值评估
http://www.linkhelper.cn/ 友情链接查询
2、拓展类
http://tool.chinaz.com/Tools/Robot.aspx 搜索蜘蛛模拟抓取
http://www2.baidu.com/inquire/price.php 百度关键词竞价查询
http://www.xml-sitemaps.com/ 网站地图在线制作
http://www.webconfs.com/similar-page-checker.php 网站相似度查询
http://tool.motoricerca.info/robots-checker.phtml robots文件在线检查工具
http://ping.chinaz.com/ 多个地点ping服务器
http://dns.aizhan.com/ IP反查域名(查询同一IP下有多少个网站)
http://top.baidu.com 百度搜索排行
http://index.baidu.com 百度指数
https://adwords.google.cn/select/KeywordToolExternal 谷歌关键词工具
http://www.google.cn/trends 谷歌搜索引擎趋势
http://sitemap.cn.yahoo.com Yahoo外部链接工具
http://siteexplorer.search.yahoo.com 网站分析(英文)
http://www.zhuici.com/ 关键词分析
http://www.pipiki.com/ 网站价值评估
http://www.linkhelper.cn/ 友情链接查询
2、拓展类
http://tool.chinaz.com/Tools/Robot.aspx 搜索蜘蛛模拟抓取
http://www2.baidu.com/inquire/price.php 百度关键词竞价查询
http://www.xml-sitemaps.com/ 网站地图在线制作
http://www.webconfs.com/similar-page-checker.php 网站相似度查询
http://tool.motoricerca.info/robots-checker.phtml robots文件在线检查工具
http://ping.chinaz.com/ 多个地点ping服务器
http://dns.aizhan.com/ IP反查域名(查询同一IP下有多少个网站)
Jun
18
robots.txt基本介绍
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
robots.txt写作语法
首先,我们来看一个robots.txt范例:http://www.csswebs.org/robots.txt
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
# Robots.txt file from http://www.csswebs.org
# All robots will spider the domain
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.csswebs.org站点下的所有文件。
具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。
下面,我将列举一些robots.txt的具体用法:
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:
Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合:
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
robots.txt写作语法
首先,我们来看一个robots.txt范例:http://www.csswebs.org/robots.txt
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
# Robots.txt file from http://www.csswebs.org
# All robots will spider the domain
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.csswebs.org站点下的所有文件。
具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。
下面,我将列举一些robots.txt的具体用法:
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:
Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合:
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。
Oct
22
Internet的变化日新月异,其庞大的容量对搜索引擎的索引更新和服务无疑是一种考验。搜索引擎也一直在努力寻求创新的途径,例如以关联站点的广泛度为基础进行排名,以此抵消对搜索引擎的spam伎俩和对页面因素恶意操纵的不良竞争结果,达到为用户提供最为精准和相关的搜索结果的目的。如今,通过将链接广泛度这个因素整合到其排名算法中,搜索引擎(例如Google)已然能够为冲浪者们提供卓越的搜索经验。
但这并不意味着我们就可以对页面因素和网站内容掉以轻心。正确的理解应该是:对于两个页面优化程度相同,内容具有相同吸引力的站点,在搜索引擎排名中胜出一筹的应当是那个链接广泛度(LP)较高的站点。简言之,象以往那样只要优化了页面就能获得非常好的排名的方法已经行不通了。你若想使自己的网站获得TOP位置,不但需要对页面进行深入优化,同时还需要增强你网站的目标链接广泛度。
链接广泛度VS链接广泛度分析
一个站点的链接广泛度是指该网站上外来链接的总数量。搜索引擎必须对这些外部链接进行跟踪索引。就在不久前,人们还相信一个站点的链接广泛度只决定于该站点外部链接的“数量”。即外部链接数越多排名越靠前。
--这只是故事的前半部分,搜索引擎软件和它们的开发者可不是聋哑人,他们已然意识到有很多网站管理员籍由虚假链接等不正当手段来达到提升其排名的目的。所以搜索引擎摈弃了这种只看数量不看质量的做法,转而将链接广泛度分析作为评判网站排名的参数之一。
所谓链接广泛度分析(以下简称“链接分析”)是指对链接数量和质量的评估及分析。链接分析与链接广泛度的不同点在于:链接广泛度指一个网站上外部导入链接的数量,而链接分析则涵盖了外部导入链接的数量和质量这两个方面。我们可以看出,在对待一个网站的外部链接的态度上,链接分析把链接的数量提到了首位。
在决定哪个页面对特定关键短语更具关联度方面,链接分析是一种极为有用,既简单而又不失安全的方法。这种方法精准地决定了你所在行业的其他人对你的网站的认可态度。
链接数量VS链接质量
最初的链接计算是基于链接数量的,即一个网页外部链接数量越多,在搜索引擎上的得分也就越高。原理如下:
假设A,B两个网页。A有2个外部链接,B有10个外部链接。因为B的外部链接数远远多于A,表明有更多站点指向B,则搜索引擎将认为页面B比页面A更具“重要性”或“权威性”,即B比A具有更高的投票权值(Voting Power)。有趣的是:由于网页具有将其投票权值平均分配给它的所有导出链接的特性,对A和B来说,在相同导出链接数量的前提下,搜索引擎认定B的导出链接比A更具重要性。换言之,PR值高而且导出链接数又少的网站成为理想的链接目标。
后来链接质量分析这一环节被引入了链接分析系统,并且把链接的质量和关联度都提到了首位。因为搜索引擎认为:一个低劣的网站几乎没可能获得高质量的外部链接。对于链接的质量,不同搜索引擎有其不同衡量方法,但要点是相通的-–只有那些与你的目标关键词关联的高质量站点的外部链接才是最理想的链接目标。即使获得上百个质量低劣的或内容毫不相干的站点的链接也抵不上一个高质量且内容高度相关或互补的站点的链接。
内链/导入链接/导出链接
内链(Internal Links)
所谓内链,即内部链接。指的是同一站点内网页之间的相互链接。可别小瞧内链,它在整个网站,尤其是对一些深层页面的浏览和检索扮演着至关重要的角色。内链在GOOGLE中的作用亦不可小觑,如同一个网站会将其PageRank值传递给链至它的站点一样,内部链接也会将其PR值传递给所链页面。所以当你通过创建外部链接而获得了更高的PR值时,如果你的网站导航结构设计合理,那么你的其它内部页面亦能够得到一定的PR值。
此外,大多数搜索引擎比较关注链接文本中出现的关键词。假设有一个摄像摄影公司,其首页的三个内链文字分别为:“婚礼摄像”、“企业专题庆典摄像”、“生日/寿庆摄像”。这些链接文字不但清楚地表明了所链接的内容,即它们究竟是什么网页,同时又充分利用目标关键词进行了优化。然而有很多网站忽略了对链接文字的优化,象返回主页链接只写着“主页”两个字的例子实在是屡见不鲜。
后链(backlink)/导入链接(inbound links)/导出链接(outbound links)
导入链接和后链(也叫逆向链接)的含义相同,指链至你网站的站点,也就是我们一般所说的“外部链接”。而当你链至另外一个站点,那么这个站点就是你的“导出链接”。所以导出链接就是你向别的网站提供的本站链接。
理论上讲搜索引擎的链接分析机制只关心你的“导入链接”,即究竟有多少站点链到了你的网站上。至于你向别的网站提供了多少本站链接,这并不是它们关心的问题。所以导出链接不会对排名造成影响。--实际上我们却发现,对你辛苦得到的“导入链接”,即使它们具有同等重要性(PR值相同),Google也并不是一视同仁,只有那些导出链接较少的“导入链接”才能使它产生好感。而在Inktomi中,一个有导出链接的站点其排名要比没有导出链接的站点稍好一点。为什么呢?--在“决定链接得分的其它因素”一节中,我们再展开讨论。
如何检查Link Popularity
不同的搜索引擎对于链接广泛度(Link Popularity)的计算方法和分析方法都是不同的。这也就是为什么你可能从AltaVista上得到很高的LP值,而在Google上却未必如此。
接下来,我们就以http://www.chinaHTML.com为例,介绍如何通过一些知名搜索引擎检查你的链接广泛度(注:指令中无须http://www前缀):
Altavista & Infoseek
LINK: chinaHTML.com
所有链至该主域的站点都将被列出来。
由于一个站点的不同页面之间是互相链接的,所以上述指令最后得到的结果中也包括了那些链接到你的索引(主)页的内部页面(我们称之为内链)。如果只想看到不包含内链的结果,可输入如下指令:
LINK:homepage.yesky.com-URL:homepage.yesky.com
如欲查看一特定页面的链接广泛度,可在Altavista中输入如下指令:
LINK:homepage.yesky.com/index.HTML
Google
LINK:homepage.yesky.com
结果为链至该主域的所有站点,包括内链。Google未提供消除内链的指令。
Inktomi及其隶属搜索引擎如HotBot, AOL, iWon和MSN
LINKDOMAIN:homepage.yesky.com
结果为链至该主域的所有站点,包括内链。
LINKDOMAIN:homepage.yesky.com-DOMAIN:homepage.yesky.com
结果为链至该主域的所有外部站点。
Fast/Alltheweb
LINK.ALL:homepage.yesky.com或LINK:homepage.yesky.com
结果为链至该主域的所有网页,包括内链。
如何策划你的外部链接
在网站的搜索引擎优化中,链接广泛度可谓最难也是最耗时间一个环节.我们建议大家从下面这几个方面着手,合理而行之有效地策划你的外部链接:
1) 确保网站提供了实用和高质量的内容:
万变不离其宗,无论排名算法再怎么变,网站内容始终是克敌制胜的最大法宝。人们总是乐意去跟那些内容丰富而独特的站点交换链接。所以,如果你的网站内容还不那么充足,那就尽量多加入内容,努力让它变成一个真正的“内容提供者”吧。可撰写一些与你的网站关键词密切相关,而又使访问者感兴趣的文章和指南。如果没时间做而且又舍得花大价钱,那就雇一个专业的撰稿人吧,切忌在这些文章中大肆宣扬你的网站,而是应当遵循真正地为访问者提供实用信息的原则。记住,你的最大资产还是你的网站内容。一旦网站提供了大量实用信息,亦会大大增加获得高质量链接的机会。
2) 向高质量站点提交网站:
搜索引擎如Google,流行网站门户如MSN,目录检索如Yahoo和DMOZ(一旦DMOZ收录了你的网站,那你就等着被Netscape Search,AOL Search,Google,Lycos,HotBot,DirectHit等一些大型搜索引擎和门户网站收录吧。) 热门网站如EBay和Amazon,新闻网站如CNN,博客(Blog)网站以及与你的网站主题相关的网站。提交之前,针对主要关键词对网站的标题和描述元标记进行合理优化是必不可少的。
此外,那些与你站点具有相关性并允许提交的专业搜索引擎和网络分类目录都是你的理想链接对象。用“submit a link”和你最重要的关键词(譬如“Foam Machines”)进行搜索,你会得到一个与你关键词最关联的链接页面的站点列表。
尽可能向更多的主题网络目录、行业目录及普通商务目录、黄页、白页提交你的网站。
要想从直接竞争者那里获得链接不太现实。我们可以另僻蹊径,转而同那些与自己网站具有互补性和相关性,同时又无直接竞争性的站点交换链接。对一家鞋业公司来说,就可以向皮革业方面的有关协会提出链接交换的请求,从而有机会赢得一个来自相关刊物或新闻站点的链接。
3) 友情链接/互惠链接:
提升一个站点链接广泛度的最古老最上乘的方法就是请求与其它站点交换链接(也称互惠链接)。你可以通过电子邮件或其它方式直接与网站主人联系,请求友情换链。可向对方提供一些免费资源,如一个实用程序或一份可下载报告等。具体实施细则和注意事项将在后面详细讨论。
4其它方法:
a) 拥有一个高质量的Newsletter或相关文献区也是提升链接得分的一个好办法。别忘了把你的Newsletter上的链接提交给Newsletter专用的网上目录。倘若链到你的网站能够为他们自己的网站的访问者提供实用信息,他们又何乐而不为呢?
b) 围绕目标关键词在一些顶级站点的电子杂志或资源区里发表文章,也是获得高质量链接的有效途径之一。在文章中作者简介一栏下,别忘了放上你的链接和能吸引人眼球的网站描述。一方面你的文章可为这些网站提供了有价值的内容,同时也为光临这些网站的访问者打开了通向你自己网站的大门。这样不单可以获得互惠链接,亦有可能获得目标客户。
c) 实施或参与“奖励计划”(Awards Program)。赢家可得到一个高质量链接作为奖励。该计划在提升链接得分上效果奇佳。
d) 设立一个讨论区。请求那些对同一个关键短语相关联的站点链至该讨论区。
e) 可以给某个网站写一封推荐信,然后请求该网站的主人将其网站链至你的站点作为互惠交换。应慎用推荐。
f) 争取生意链中的对象,包括合作伙伴,分销商,代理商,供应商等的站点链接。可为客户提供小小折扣来获得他们的链接。
g) 提供HTML源代码信息。这样链接交换对象只需简单复制这些代码并嵌入自己网页便可轻松交换链接。
h) 链接的底线—应该多少才够?--只要比你的竞争者多一个高质量的外部链接就OK。
但这并不意味着我们就可以对页面因素和网站内容掉以轻心。正确的理解应该是:对于两个页面优化程度相同,内容具有相同吸引力的站点,在搜索引擎排名中胜出一筹的应当是那个链接广泛度(LP)较高的站点。简言之,象以往那样只要优化了页面就能获得非常好的排名的方法已经行不通了。你若想使自己的网站获得TOP位置,不但需要对页面进行深入优化,同时还需要增强你网站的目标链接广泛度。
链接广泛度VS链接广泛度分析
一个站点的链接广泛度是指该网站上外来链接的总数量。搜索引擎必须对这些外部链接进行跟踪索引。就在不久前,人们还相信一个站点的链接广泛度只决定于该站点外部链接的“数量”。即外部链接数越多排名越靠前。
--这只是故事的前半部分,搜索引擎软件和它们的开发者可不是聋哑人,他们已然意识到有很多网站管理员籍由虚假链接等不正当手段来达到提升其排名的目的。所以搜索引擎摈弃了这种只看数量不看质量的做法,转而将链接广泛度分析作为评判网站排名的参数之一。
所谓链接广泛度分析(以下简称“链接分析”)是指对链接数量和质量的评估及分析。链接分析与链接广泛度的不同点在于:链接广泛度指一个网站上外部导入链接的数量,而链接分析则涵盖了外部导入链接的数量和质量这两个方面。我们可以看出,在对待一个网站的外部链接的态度上,链接分析把链接的数量提到了首位。
在决定哪个页面对特定关键短语更具关联度方面,链接分析是一种极为有用,既简单而又不失安全的方法。这种方法精准地决定了你所在行业的其他人对你的网站的认可态度。
链接数量VS链接质量
最初的链接计算是基于链接数量的,即一个网页外部链接数量越多,在搜索引擎上的得分也就越高。原理如下:
假设A,B两个网页。A有2个外部链接,B有10个外部链接。因为B的外部链接数远远多于A,表明有更多站点指向B,则搜索引擎将认为页面B比页面A更具“重要性”或“权威性”,即B比A具有更高的投票权值(Voting Power)。有趣的是:由于网页具有将其投票权值平均分配给它的所有导出链接的特性,对A和B来说,在相同导出链接数量的前提下,搜索引擎认定B的导出链接比A更具重要性。换言之,PR值高而且导出链接数又少的网站成为理想的链接目标。
后来链接质量分析这一环节被引入了链接分析系统,并且把链接的质量和关联度都提到了首位。因为搜索引擎认为:一个低劣的网站几乎没可能获得高质量的外部链接。对于链接的质量,不同搜索引擎有其不同衡量方法,但要点是相通的-–只有那些与你的目标关键词关联的高质量站点的外部链接才是最理想的链接目标。即使获得上百个质量低劣的或内容毫不相干的站点的链接也抵不上一个高质量且内容高度相关或互补的站点的链接。
内链/导入链接/导出链接
内链(Internal Links)
所谓内链,即内部链接。指的是同一站点内网页之间的相互链接。可别小瞧内链,它在整个网站,尤其是对一些深层页面的浏览和检索扮演着至关重要的角色。内链在GOOGLE中的作用亦不可小觑,如同一个网站会将其PageRank值传递给链至它的站点一样,内部链接也会将其PR值传递给所链页面。所以当你通过创建外部链接而获得了更高的PR值时,如果你的网站导航结构设计合理,那么你的其它内部页面亦能够得到一定的PR值。
此外,大多数搜索引擎比较关注链接文本中出现的关键词。假设有一个摄像摄影公司,其首页的三个内链文字分别为:“婚礼摄像”、“企业专题庆典摄像”、“生日/寿庆摄像”。这些链接文字不但清楚地表明了所链接的内容,即它们究竟是什么网页,同时又充分利用目标关键词进行了优化。然而有很多网站忽略了对链接文字的优化,象返回主页链接只写着“主页”两个字的例子实在是屡见不鲜。
后链(backlink)/导入链接(inbound links)/导出链接(outbound links)
导入链接和后链(也叫逆向链接)的含义相同,指链至你网站的站点,也就是我们一般所说的“外部链接”。而当你链至另外一个站点,那么这个站点就是你的“导出链接”。所以导出链接就是你向别的网站提供的本站链接。
理论上讲搜索引擎的链接分析机制只关心你的“导入链接”,即究竟有多少站点链到了你的网站上。至于你向别的网站提供了多少本站链接,这并不是它们关心的问题。所以导出链接不会对排名造成影响。--实际上我们却发现,对你辛苦得到的“导入链接”,即使它们具有同等重要性(PR值相同),Google也并不是一视同仁,只有那些导出链接较少的“导入链接”才能使它产生好感。而在Inktomi中,一个有导出链接的站点其排名要比没有导出链接的站点稍好一点。为什么呢?--在“决定链接得分的其它因素”一节中,我们再展开讨论。
如何检查Link Popularity
不同的搜索引擎对于链接广泛度(Link Popularity)的计算方法和分析方法都是不同的。这也就是为什么你可能从AltaVista上得到很高的LP值,而在Google上却未必如此。
接下来,我们就以http://www.chinaHTML.com为例,介绍如何通过一些知名搜索引擎检查你的链接广泛度(注:指令中无须http://www前缀):
Altavista & Infoseek
LINK: chinaHTML.com
所有链至该主域的站点都将被列出来。
由于一个站点的不同页面之间是互相链接的,所以上述指令最后得到的结果中也包括了那些链接到你的索引(主)页的内部页面(我们称之为内链)。如果只想看到不包含内链的结果,可输入如下指令:
LINK:homepage.yesky.com-URL:homepage.yesky.com
如欲查看一特定页面的链接广泛度,可在Altavista中输入如下指令:
LINK:homepage.yesky.com/index.HTML
LINK:homepage.yesky.com
结果为链至该主域的所有站点,包括内链。Google未提供消除内链的指令。
Inktomi及其隶属搜索引擎如HotBot, AOL, iWon和MSN
LINKDOMAIN:homepage.yesky.com
结果为链至该主域的所有站点,包括内链。
LINKDOMAIN:homepage.yesky.com-DOMAIN:homepage.yesky.com
结果为链至该主域的所有外部站点。
Fast/Alltheweb
LINK.ALL:homepage.yesky.com或LINK:homepage.yesky.com
结果为链至该主域的所有网页,包括内链。
如何策划你的外部链接
在网站的搜索引擎优化中,链接广泛度可谓最难也是最耗时间一个环节.我们建议大家从下面这几个方面着手,合理而行之有效地策划你的外部链接:
1) 确保网站提供了实用和高质量的内容:
万变不离其宗,无论排名算法再怎么变,网站内容始终是克敌制胜的最大法宝。人们总是乐意去跟那些内容丰富而独特的站点交换链接。所以,如果你的网站内容还不那么充足,那就尽量多加入内容,努力让它变成一个真正的“内容提供者”吧。可撰写一些与你的网站关键词密切相关,而又使访问者感兴趣的文章和指南。如果没时间做而且又舍得花大价钱,那就雇一个专业的撰稿人吧,切忌在这些文章中大肆宣扬你的网站,而是应当遵循真正地为访问者提供实用信息的原则。记住,你的最大资产还是你的网站内容。一旦网站提供了大量实用信息,亦会大大增加获得高质量链接的机会。
2) 向高质量站点提交网站:
搜索引擎如Google,流行网站门户如MSN,目录检索如Yahoo和DMOZ(一旦DMOZ收录了你的网站,那你就等着被Netscape Search,AOL Search,Google,Lycos,HotBot,DirectHit等一些大型搜索引擎和门户网站收录吧。) 热门网站如EBay和Amazon,新闻网站如CNN,博客(Blog)网站以及与你的网站主题相关的网站。提交之前,针对主要关键词对网站的标题和描述元标记进行合理优化是必不可少的。
此外,那些与你站点具有相关性并允许提交的专业搜索引擎和网络分类目录都是你的理想链接对象。用“submit a link”和你最重要的关键词(譬如“Foam Machines”)进行搜索,你会得到一个与你关键词最关联的链接页面的站点列表。
尽可能向更多的主题网络目录、行业目录及普通商务目录、黄页、白页提交你的网站。
要想从直接竞争者那里获得链接不太现实。我们可以另僻蹊径,转而同那些与自己网站具有互补性和相关性,同时又无直接竞争性的站点交换链接。对一家鞋业公司来说,就可以向皮革业方面的有关协会提出链接交换的请求,从而有机会赢得一个来自相关刊物或新闻站点的链接。
3) 友情链接/互惠链接:
提升一个站点链接广泛度的最古老最上乘的方法就是请求与其它站点交换链接(也称互惠链接)。你可以通过电子邮件或其它方式直接与网站主人联系,请求友情换链。可向对方提供一些免费资源,如一个实用程序或一份可下载报告等。具体实施细则和注意事项将在后面详细讨论。
4其它方法:
a) 拥有一个高质量的Newsletter或相关文献区也是提升链接得分的一个好办法。别忘了把你的Newsletter上的链接提交给Newsletter专用的网上目录。倘若链到你的网站能够为他们自己的网站的访问者提供实用信息,他们又何乐而不为呢?
b) 围绕目标关键词在一些顶级站点的电子杂志或资源区里发表文章,也是获得高质量链接的有效途径之一。在文章中作者简介一栏下,别忘了放上你的链接和能吸引人眼球的网站描述。一方面你的文章可为这些网站提供了有价值的内容,同时也为光临这些网站的访问者打开了通向你自己网站的大门。这样不单可以获得互惠链接,亦有可能获得目标客户。
c) 实施或参与“奖励计划”(Awards Program)。赢家可得到一个高质量链接作为奖励。该计划在提升链接得分上效果奇佳。
d) 设立一个讨论区。请求那些对同一个关键短语相关联的站点链至该讨论区。
e) 可以给某个网站写一封推荐信,然后请求该网站的主人将其网站链至你的站点作为互惠交换。应慎用推荐。
f) 争取生意链中的对象,包括合作伙伴,分销商,代理商,供应商等的站点链接。可为客户提供小小折扣来获得他们的链接。
g) 提供HTML源代码信息。这样链接交换对象只需简单复制这些代码并嵌入自己网页便可轻松交换链接。
h) 链接的底线—应该多少才够?--只要比你的竞争者多一个高质量的外部链接就OK。
Oct
22
翻译:海淼(出自国外某知名SEO网站)
下面介绍的都是正常优化,需要的仅仅是一些时间和工作。还犹豫什么,行动吧:
1、域名和文件名
选择一个包含你主要关键词的域名和文件名,你的域名应该方便拼写和记忆,你的关键词在许多情况下,就该是你的文件名。如果你的关键词是google排名,最好你的域名中带有google,最好的方法是google.com大于xxgoogle.com大于google.xxx.com大于xxx.com/google,同时,文件名最好是google.htm,比如个人兴趣所致,随意而做的一个网页,google排名, http://www.earth365.com/google/google.htm
2、关键词短语
a.使用一个容易被搜索到的关键词,不一定非要是热门关键词.你可以在google中查询一个,看查询结查中有多少页包含这个关键词,你就知道这个关键词的效果.
b.在文本中添加与关键词相近的关键词短语.比如:google排名,可以加一些google左侧排名,google排名优化.
c.在title中放置关键词(这是非常重要的)<title>关键词</title>
d.在页面开始处放置一个<h1>关键词</h1>.关键词相近的短语可以放在<h2><h3>中.<h1><h2><h3>中所用的主要关键词在title中最好都有.如果你有很多关键词需要优化,建议你分成多个页面优化.如果你的关键词比较热门,建议一个页面最多优化三个主要关键词.
e.确信你链接所使用的文本是你链接所指向页面的主要关键词,在网站地图中,建议也使用这个文本做为链接.比如我在个人网站地球村中有一个链接,指向页面的主要关键词是"地球"这个关键词,我会用<a href="http://www.earth365.com";>地球</a>. 注意,指向页面的主要关键词是"地球",所以建议最好链接文本使用"地球",这一些在做反向链接的时候最重要的.
3、关键词密度
对于网络优化来说,关键词密度是非常重要的.关键词密度指的是你的"关键词"的数量在你文本中所占的比率.你可以分析一下你的竞争对手使用关键词的密度.一个高的关键词密度会被搜索引擎认为做弊,而列入到黑名单并除名.一般认为4%左右最合适.
你的关键词在网页中位置越前越好,至于要不要在每一段中都有你的关键词,取决于你网页文本的长度.(有个别网站,在<html>代码前加一些关键词,这种方法对于搜索引擎来说,是没有用的).
4、坏的技巧
坏的技巧会被搜索引擎列入黑名单,被除名.许多技巧会被认为是做弊,比如:cloaking,隐形文字,小得看不见的文字,完全一样的页面,门页,刷新标签(这种情况发生在针对搜索引擎做好页面排名,然后跳转,时间设的太短),链接工厂,只用关键词填充注释,高密度的关键词,镜射页面,镜射站点.注意,作者标签中也用关键词,也可能被认为是做弊,以及网页中所有图象均用同样的关键词做alt.
当你用这些技巧的时候,有可能在短时间内得到高的排名,但是不久,你的站点将会会到惩罚.
5、标题和说明标签
title是优化关键词最重要的一部分,每一个页面应该有2-3个不同的主要关键词,这几个关键词最好在该网页中位置越前越好,一般建议title不超过75个字符.
下面是一个简短的description说明:
content="说明短语",你的说明应该至少有2-3个你的关键词,你的第一句话也应该有你的关键词.每一个页面中,"titlte","description","keyword"说明应该是不一样的.你可以使用一个关键词,也可以使用关键词短语作为标题提高关键词的相关性.
description 最好把主要关键词写成句子,比如地球村: http://www.earth365.com 我是这样写的:<meta name="description" content="地球村,主要介绍地球,地球地理,地球图片,地球环保,地球科学.地球村,一个网上的地球家园,地球之谜,治理沙漠,中国文化.地球村,一片宁静的地球乐土,为您提供地球的一些知识,地球环保,地球文化.欢迎来地球村坐客.">
提醒:你可以在文本最后加上你的域名,有一定好处. 比如个人网站,爱护地球: http://www.earth365.com/earth365/kio06/index.htm 在最后面,我就有加:Copyright 2003-2005 www.earth365.com All Rights Reserved, 把域名加在了最后面.
6、关键词标签
如今,关键词标签由于很容易被人做弊,已经被google基本上忽视,但是在yahoo,以及其他一些搜索引擎中还是偶尔用到.每个页面建议用不同的keyword,也不要累加关键词.
7、作者以及Robots标签
作者标签应该不是你的关键词,而是你的公司名,这样用助于你的公司排名排在第一的位置.
<META content="你的公司名" name=Author>
<META content="Copyright 2004-2005 XXX所有" name=Copyright>
Robots标签主要说明哪些页面你希望搜索引擎检索,哪些不希望被检索,如果都希望被检索,可以不用Robots标签,或者用:
<meta name="robots" content="index,follow"/>
8、有质量的内容
一个好的内容的网站是至关重要的,他可以吸引人们下次还来访问,并告诉其他人来访问,并会为你带来相当多的反向链接.你的内容一定首先要有你的关键词.
9、内容的数量
内容丰富一点当然是最好.一定记注,内容和质量是网站生存的基础.
10、动态改变的内容
如果有一个页面有动态需要改变的内容,可以使用script,.你可以用几个段落写几段script.在htm网页中,用script作一些改动.
11、避免使用动态域名
你的页面是通过PHP,ASP或者cf? 有些搜索引擎检索他们的时候会有问题.尽可能地使用静态页面.避免使用php,asp 或者 cf页中"?",
动态网页是非常实用的,但是他们有一个数据库驱动,确信你的导航和网站地图链向earth365.com 而不是 earth365.com?vn=0
12、框架
许多搜索引擎不能检索框架中的链接,最好不要用框架.如果一定要用,建议使用交替的办法使搜索引擎能检索到你的页面.
13、网站地图
一个最好的导航其实是你的网站地图.一个好的网站导航结构是你站内所有页面都有一个链接指向你站内最重要的页面.比如,你的首页.
同时,如果你的网站很大,网站地图每页应该链接数量不超过100个链接,分成多个页面来做.
14、网站主题
当一个搜索引擎检索一个网站时,他会检索这个网站的主题和普通的标题,确定网站的主要主题.如果你的网站有一个特定的主题,你将比那些网站中只有几个标题和内容提及这个主题的关键词到得更好的排名.使用相似的关键词使用在每个不同的页面,搜索引擎将会检测到你的网站主题,这样你会有更大的优势.比如,我的网站 http://www.earth365.com 主题是"地球",在很多页面,我都用到了地球相关的关键词,比如"地球村","地球环保","地球奇迹"等等,这样提升了网站主题"地球"的优势.
15、网站设计
记注一点,我们的网站是做给用户看的,而不是做给搜索引擎看的.如果你的网站有一个坏的配色,或者没有组织好,不方便阅读,那么你的所有优化工作都只是在浪费时间.
确定你的网站设计方便用户使用,确定用户在你的网站内能很快找到他想要找到的东西.
16、分离内容和css样式
把你的所有格式放在css样式中,搜索引擎会更倾向于这种格式,这种方式还可以使你的网页文件大小减少,文本内容更多,会有很多好处。
下面介绍的都是正常优化,需要的仅仅是一些时间和工作。还犹豫什么,行动吧:
1、域名和文件名
选择一个包含你主要关键词的域名和文件名,你的域名应该方便拼写和记忆,你的关键词在许多情况下,就该是你的文件名。如果你的关键词是google排名,最好你的域名中带有google,最好的方法是google.com大于xxgoogle.com大于google.xxx.com大于xxx.com/google,同时,文件名最好是google.htm,比如个人兴趣所致,随意而做的一个网页,google排名, http://www.earth365.com/google/google.htm
2、关键词短语
a.使用一个容易被搜索到的关键词,不一定非要是热门关键词.你可以在google中查询一个,看查询结查中有多少页包含这个关键词,你就知道这个关键词的效果.
b.在文本中添加与关键词相近的关键词短语.比如:google排名,可以加一些google左侧排名,google排名优化.
c.在title中放置关键词(这是非常重要的)<title>关键词</title>
d.在页面开始处放置一个<h1>关键词</h1>.关键词相近的短语可以放在<h2><h3>中.<h1><h2><h3>中所用的主要关键词在title中最好都有.如果你有很多关键词需要优化,建议你分成多个页面优化.如果你的关键词比较热门,建议一个页面最多优化三个主要关键词.
e.确信你链接所使用的文本是你链接所指向页面的主要关键词,在网站地图中,建议也使用这个文本做为链接.比如我在个人网站地球村中有一个链接,指向页面的主要关键词是"地球"这个关键词,我会用<a href="http://www.earth365.com";>地球</a>. 注意,指向页面的主要关键词是"地球",所以建议最好链接文本使用"地球",这一些在做反向链接的时候最重要的.
3、关键词密度
对于网络优化来说,关键词密度是非常重要的.关键词密度指的是你的"关键词"的数量在你文本中所占的比率.你可以分析一下你的竞争对手使用关键词的密度.一个高的关键词密度会被搜索引擎认为做弊,而列入到黑名单并除名.一般认为4%左右最合适.
你的关键词在网页中位置越前越好,至于要不要在每一段中都有你的关键词,取决于你网页文本的长度.(有个别网站,在<html>代码前加一些关键词,这种方法对于搜索引擎来说,是没有用的).
4、坏的技巧
坏的技巧会被搜索引擎列入黑名单,被除名.许多技巧会被认为是做弊,比如:cloaking,隐形文字,小得看不见的文字,完全一样的页面,门页,刷新标签(这种情况发生在针对搜索引擎做好页面排名,然后跳转,时间设的太短),链接工厂,只用关键词填充注释,高密度的关键词,镜射页面,镜射站点.注意,作者标签中也用关键词,也可能被认为是做弊,以及网页中所有图象均用同样的关键词做alt.
当你用这些技巧的时候,有可能在短时间内得到高的排名,但是不久,你的站点将会会到惩罚.
5、标题和说明标签
title是优化关键词最重要的一部分,每一个页面应该有2-3个不同的主要关键词,这几个关键词最好在该网页中位置越前越好,一般建议title不超过75个字符.
下面是一个简短的description说明:
content="说明短语",你的说明应该至少有2-3个你的关键词,你的第一句话也应该有你的关键词.每一个页面中,"titlte","description","keyword"说明应该是不一样的.你可以使用一个关键词,也可以使用关键词短语作为标题提高关键词的相关性.
description 最好把主要关键词写成句子,比如地球村: http://www.earth365.com 我是这样写的:<meta name="description" content="地球村,主要介绍地球,地球地理,地球图片,地球环保,地球科学.地球村,一个网上的地球家园,地球之谜,治理沙漠,中国文化.地球村,一片宁静的地球乐土,为您提供地球的一些知识,地球环保,地球文化.欢迎来地球村坐客.">
提醒:你可以在文本最后加上你的域名,有一定好处. 比如个人网站,爱护地球: http://www.earth365.com/earth365/kio06/index.htm 在最后面,我就有加:Copyright 2003-2005 www.earth365.com All Rights Reserved, 把域名加在了最后面.
6、关键词标签
如今,关键词标签由于很容易被人做弊,已经被google基本上忽视,但是在yahoo,以及其他一些搜索引擎中还是偶尔用到.每个页面建议用不同的keyword,也不要累加关键词.
7、作者以及Robots标签
作者标签应该不是你的关键词,而是你的公司名,这样用助于你的公司排名排在第一的位置.
<META content="你的公司名" name=Author>
<META content="Copyright 2004-2005 XXX所有" name=Copyright>
Robots标签主要说明哪些页面你希望搜索引擎检索,哪些不希望被检索,如果都希望被检索,可以不用Robots标签,或者用:
<meta name="robots" content="index,follow"/>
8、有质量的内容
一个好的内容的网站是至关重要的,他可以吸引人们下次还来访问,并告诉其他人来访问,并会为你带来相当多的反向链接.你的内容一定首先要有你的关键词.
9、内容的数量
内容丰富一点当然是最好.一定记注,内容和质量是网站生存的基础.
10、动态改变的内容
如果有一个页面有动态需要改变的内容,可以使用script,.你可以用几个段落写几段script.在htm网页中,用script作一些改动.
11、避免使用动态域名
你的页面是通过PHP,ASP或者cf? 有些搜索引擎检索他们的时候会有问题.尽可能地使用静态页面.避免使用php,asp 或者 cf页中"?",
动态网页是非常实用的,但是他们有一个数据库驱动,确信你的导航和网站地图链向earth365.com 而不是 earth365.com?vn=0
12、框架
许多搜索引擎不能检索框架中的链接,最好不要用框架.如果一定要用,建议使用交替的办法使搜索引擎能检索到你的页面.
13、网站地图
一个最好的导航其实是你的网站地图.一个好的网站导航结构是你站内所有页面都有一个链接指向你站内最重要的页面.比如,你的首页.
同时,如果你的网站很大,网站地图每页应该链接数量不超过100个链接,分成多个页面来做.
14、网站主题
当一个搜索引擎检索一个网站时,他会检索这个网站的主题和普通的标题,确定网站的主要主题.如果你的网站有一个特定的主题,你将比那些网站中只有几个标题和内容提及这个主题的关键词到得更好的排名.使用相似的关键词使用在每个不同的页面,搜索引擎将会检测到你的网站主题,这样你会有更大的优势.比如,我的网站 http://www.earth365.com 主题是"地球",在很多页面,我都用到了地球相关的关键词,比如"地球村","地球环保","地球奇迹"等等,这样提升了网站主题"地球"的优势.
15、网站设计
记注一点,我们的网站是做给用户看的,而不是做给搜索引擎看的.如果你的网站有一个坏的配色,或者没有组织好,不方便阅读,那么你的所有优化工作都只是在浪费时间.
确定你的网站设计方便用户使用,确定用户在你的网站内能很快找到他想要找到的东西.
16、分离内容和css样式
把你的所有格式放在css样式中,搜索引擎会更倾向于这种格式,这种方式还可以使你的网页文件大小减少,文本内容更多,会有很多好处。










