当前位置:首页 >探索 > 正文

怎么写s是什么

2025-11-03 15:56:43探索

一、什么是robots.txt?

robots是网站和搜索引擎协议的纯文本文件 ,当一个搜索引擎蜘蛛来访问站点的时候 ,首先爬行检查根目录是否存在这个文件 。如果存在的话 ,那么就会根据文件的内容来确定访问范围 ,如果没有的话蜘蛛就会沿着链接进行抓取,robots放在项目的根目录下。

二 、 robots.txt基本语法 :

1、允许所有搜索引擎访问网站的所有部分 ,robots.txt写法如下

User-agent:

*

Disallow:

或者

User-agent:

*

Allow: /

注意  : 1. 首个英文要大写 ,冒号是英文状态下  ,冒号后面有一个空格,这几点一定不能写错。

2 、禁止所有搜索引擎访问网站的所有部分

robots.txt写法如下 :

User-agent:

*

Disallow: /

3  、只需要禁止蜘蛛访问某个目录 ,比如禁止admin、css、images等目录被索引

robots.txt写法如下:

User-agent:

*

Disallow: /css/

Disallow: /admin/

Disallow: /images/

注意:路径后面有斜杠和没有斜杠的区别 :比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽

4  、屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main

robots.txt写法如下 :

User-agent:

*

Disallow: /templets

Allow: /main

5、 禁止访问/html/目录下的所有以”.php”为后缀的URL(包含子目录)

robots.txt写法如下 :

User-agent:

*

Disallow: /html/*.php

6、 仅允许访问某目录下某个后缀的文件,则使用“$”

robots.txt写法如下:

User-agent:

*

Allow: .html$

Disallow: /

7、禁止索引网站中所有的动态页面

比如这里限制的是有“?”的域名 ,例如index.php?id=1

robots.txt写法如下:

User-agent:

*

Disallow: /*?

*

8 、 禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加)

有些时候 ,我们为了节省服务器资源 ,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外 ,还 可以采取直接屏蔽图片后缀名的方式 。

robots.txt写法如下 :

User-agent:

*

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

三、写robots.txt要注意的地方 :

1)  、 首个英文要大写 ,冒号是英文状态下,冒号后面有一个空格 ,这几点一定不能写错 。

2.)、斜杠 :/ 代表整个网站

3)、如果“/”后面多了一个空格 ,则屏蔽整个网站

4)  、不要禁止正常的内容

5) 、生效时间是几天到两个月

四 、robots.txt文件对网站优化有什么作用?

1 、疾速增加网站权重和拜访量;

2、制止某些文件被查找引擎索引 ,能够节约服务器带宽和网站拜访速度;

3、为查找引擎供给一个简洁明了的索引环境

内容看完了 © 版权声明 1:本网站名称:蜡笔傻新

2:本站永久网址 :https://labishaxin.com/

3:本站部分内容收集于互联网,如果有侵权内容 、请联系我们删除 ,不妥之处,敬请谅解

4:本站一切资源不代表本站立场 ,并不代表本站赞同其观点和对其真实性负责

5:本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报

6:本站资源大多存储在云盘 ,如发现链接失效 ,请联系我们我们会第一时间更新

最近关注

友情链接