北京SEO

对于SEO(网站优化)感到很迷茫,寻找突破口中!!本站立志做一个有用的博客,如果你有好的zblog模板可以共享送我一份哈。。。QQ754042
    • 主页
    • 北京SEO服务
    • 搜索
    • 标签
    • 了解星默

  • 北京SEO首页
  • 星默SEO观点
  • SEO精华文章
  • SEO技术
  • SEM
  • SEO研究
  • SEO工具
  • google排名研究
  • 百度排名研究
  • 名人观点
  • 英文SEO

最新文章

  • 谷歌排名飞跃-首页-几百-首页
  • 框计算中的需求分析概述
  • 浅谈互联网页面价值
  • 关注seowhy被K事件
  • 2011年谷歌seo变革
  • 好大夫网站SEO分析
  • 百度竞价6.30算法升级-“高级短
  • Google网站管理员【抓取错误】
  • 电商要拥有自己的网店平台
  • 到底电商圈是个啥
  • 电商圈你也觉得一个人好么?
  • 电商圈4.3排名
  • 电商圈能圈的住爱情不?
  • 电商圈比赛报名送10QB,更有后续

随机推荐

  • 寝室停电,汗个!
  • 网站是否被挂马在线监测
  • SEO导航_SEO名站_SEO名人博客-
  • 百度,Google,雅虎等搜索引擎蜘
  • 如何判断一个关键词的优化难度
  • seo什么意思戛纳电影节片单解析
  • seo网络推广招聘月薪10000招聘
  • seo优化文章seo网站优化10大基
  • 整形美容答疑—九大问题全面解析

热门标签

  • seo (47)
  • seo收录 (31)
  • 百度 (29)
  • 博百优 (22)
  • seo关键字 (21)
  • 北京seo (20)
  • seo关键词技术 (20)
  • seo网络推广 (20)
  • seo是什么东西 (19)
  • 上海seo服务 (19)
  • 反向链接 (18)
  • seo什么意思 (18)
  • 搜索引擎 (17)
  • seo优化文章 (17)
  • 火焰SEO (16)

网站收藏

  • 北京搬家公司
  • 搬家公司
  • 北京搬家公司
  • 北京搬家公司
  • 四通搬家公司
网站优化、北京SEO服务

详细请加QQ754042

什么是robots.txt ?

发布:北京SEO | 时间: 2010年1月20日 | 分类:SEO技术 | 评论:0 | 引用:0 | 浏览: | 原创文章,转载请注明出处,谢谢。

robots.txt 的概念

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制。这些漫游器是自动的,在其访问网页前会查看是否存在阻止其访问特定网页的 robots.txt 文件。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

如何创建 robots.txt 文件?

User-Agent:适用下列规则的漫游器
Disallow:要拦截的网页
这两行被视为文件中的一个条目。您可根据需要包含任意多个条目。您可在一个条目中包含多个 Disallow 行和多个 User-Agent。

dedecms默认robots.txt 举例

User-agent: *
Disallow: /plus/ad_js.php
Disallow: /plus/advancedsearch.php
Disallow: /plus/car.php
Disallow: /plus/carbuyaction.php
Disallow: /plus/shops_buyaction.php
Disallow: /plus/erraddsave.php
Disallow: /plus/posttocar.php
Disallow: /plus/disdls.php
Disallow: /plus/feedback_js.php
Disallow: /plus/mytag_js.php
Disallow: /plus/rss.php
Disallow: /plus/search.php
Disallow: /plus/recommend.php
Disallow: /plus/stow.php
Disallow: /plus/count.php
Disallow: /include
Disallow: /templets

应在 User-Agent 行中列出什么内容?
user-agent 是特定的搜索引擎漫游器。网络漫游器数据库列出了许多常用漫游器。您可设置应用于特定漫游器的条目(通过列示名称)或设置为应用于所有漫游器(通过列示星号)。应用于所有漫游器的条目应与下列条目类似:

User-Agent:*Google 使用多种不同漫游器(用户代理)。用于网络搜索的漫游器是 Googlebot。Googlebot-Mobile 和 Googlebot-Image 等其他漫游器遵循您为 Googlebot 设置的规则,您还可为这些特定漫游器设置附加规则。

应在 Disallow 行中列出什么内容?

Disallow 行列出了您要拦截的网页。您可列出具体网址或网址模式。条目应以正斜杠开头 (/)。

要拦截整个网站,请使用正斜扛。

Disallow:/要拦截目录及其中的所有内容,请在目录名后添加正斜扛。

Disallow:/private_directory/要拦截网页,请列出该网页。

Disallow:/private_file.html网址区分大小写。例如,Disallow: /private_file.html 将拦截 http://www.example.com/private_file.html,但允许 http://www.example.com/Private_File.html。

robots.txt文件用法举例

例1. 禁止所有搜索引擎访问网站的任何部分
 
  下载该robots.txt文件
User-agent: *
 
  Disallow: /
例2. 允许所有的robot访问
 
  (或者也可以建一个空文件 "/robots.txt")
 
  
User-agent: *
 
  Disallow:

 
  或者
 
  User-agent: *
 
  Allow: /
例3. 仅禁止Baiduspider访问您的网站 User-agent: Baiduspider
 
  Disallow: /
例4. 仅允许Baiduspider访问您的网站 User-agent: Baiduspider
 
  Disallow:

 
  User-agent: *
 
  Disallow: /
例5. 禁止spider访问特定目录
 
  在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即robot不会访问这三个目录。需要注意的是对每一个目录必须分开声明,而不能写成 "Disallow: /cgi-bin/ /tmp/"。
 
  
User-agent: *
 
  Disallow: /cgi-bin/
 
  Disallow: /tmp/
 
  Disallow: /~joe/
例6. 允许访问特定目录中的部分url
 
  
User-agent: *
 
  Allow: /cgi-bin/see
 
  Allow: /tmp/hi
 
  Allow: /~joe/look
 
  Disallow: /cgi-bin/
 
  Disallow: /tmp/
 
  Disallow: /~joe/
例7. 使用"*"限制访问url
 
  禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
 
  
User-agent: *
 
  Disallow: /cgi-bin/*.htm
 
  
例8. 使用"$"限制访问url
 
  仅允许访问以".htm"为后缀的URL。
User-agent: *
 
  Allow: .htm$
 
  Disallow: /
例9. 禁止访问网站中所有的动态页面
 
  
User-agent: *
 
  Disallow: /*?*
例10. 禁止Baiduspider抓取网站上所有图片
 
  仅允许抓取网页,禁止抓取任何图片。
User-agent: Baiduspider
 
  Disallow: .jpg$
 
  Disallow: .jpeg$
 
  Disallow: .gif$
 
  Disallow: .png$
 
  Disallow: .bmp$
例11. 仅允许Baiduspider抓取网页和.gif格式图片
 
  允许抓取网页和gif格式图片,不允许抓取其他格式图片
User-agent: Baiduspider
 
  Allow: .gif$
 
  Disallow: .jpg$
 
  Disallow: .jpeg$
 
  Disallow: .png$
 
  Disallow: .bmp$
例12. 仅禁止Baiduspider抓取.jpg格式图片 User-agent: Baiduspider
 
  Disallow: .jpg$




 

[seo外链资源] [百度指数准吗?]

 

本文来源于:北京SEO http://www.fireseo.com.cn/ , 原文地址:http://www.fireseo.com.cn/seojishu/what-robots-txt/
  • 上一篇:想说一些关于SEO的话
  • 下一篇:百度被黑后续报道
  • 相关标签:SEO基础 SEO名词
  • 引用通告:点击这里获取该日志的TrackBack引用地址
  • 相关文章:
  • 关键词策略-关键词优化 (2010-1-17 20:35:47)
  • 什么是桥页(Doorway Pages)门页,跳页-SEO (2010-1-16 9:26:51)
  • 什么是网站跳出率? (2010-1-15 22:52:35)

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

  • 关于我们
  • 网站地图
  • 与我们联系
  • Archiver
  • rss
Copyright © 2009-2010 www.fireseo.com.cn. Some Rights Reserved.北京SEO SEO 版权所有