网站首页
教程下载
源码下载
字体下载
模板下载
美女图片
Flash频道
论坛交流
收藏本站
设为首页
繁體中文
新闻资讯
┊
网络冲浪
┊
网页设计
┊
网络编程
┊
图形图像
┊
数据库
┊
网络媒体
┊
服务器
┊
网络安全
┊
网站运营
┊
软件教程
┊
黑客
┊
认证
┊
Wap技术
教程搜索:
标题
全文
作者
选择类别
新闻资讯
网络冲浪
网页设计
网络编程
图形图象
数 据 库
网络媒体
服 务 器
网络安全
黑客教程
网站运营
认证考试
程序开发
Wap技术
高级搜索
网站信息查询工具
首页
>
网页设计
>
HTML/CSS
> 正文
搜索引擎的蜘蛛人(ROBOTS)秘密
日期:2006-1-19 8:55:04 来源:网络 作者:无名 浏览:次
我们知道,搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。
对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签。
一、 robots.txt
1、 什么是robots.txt?
robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被robots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取。
robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
网站 URL
相应的 robots.txt的 URL
http://www.w3.org/
http://www.w3.org/robots.txt
http://www.w3.org:80/
http://www.w3.org:80/robots.txt
http://www.w3.org:1234/
http://www.w3.org:1234/robots.txt
http://w3.org/
http://w3.org/robots.txt
本新闻共
9
页,当前在第
1
页
1
2
3
4
5
6
7
8
9
上一篇:
样 式 表 全 接 触(8)
下一篇:
CSS超级技巧大放送(1)
返回列表
打印此页
加入收藏
资讯论坛
关闭窗口
点击复制本页地址,发送给QQ/MSN好友
关于我们
-
联系我们
-
版权声明
-
帮助(?)
-
广告服务
-
友情链接
-
服务项目
-
人才招聘
2003-2008 版权所有 ©
晨风资讯网
未经授权禁止复制或建立镜像
CopyRight 2003-2008
www.Net118.com
,All Rights Reserved.Design By
ChenFeng Network Studio