请选择 进入手机版 | 继续访问电脑版
查看: 495|回复: 0

[学院同学汇] 搜索引擎原理

[复制链接]
发表于 2017-6-3 11:32:20 | 显示全部楼层 |阅读模式
每天搜索引擎的机器人就像蜘蛛一样在互联网上顺着网站地址爬来爬去。把更多的新的网站存入自己的数据库中。供人们搜索的时候用到。
所以我们要想在搜索引擎中搜索到自己的网站比如这个网站(yyk.39.net/nj/zhuanke/fc864.html),那么我们就必须先让搜索引擎收录我们的网站。网站收录也一直是困扰新手的一大难题。一般新站百度(这里我们主要讲百度优化)收录时间为一周内。搜索引擎有个缓存期,即抓取了你的网站放在缓存期里,但不会放出来,一般缓存期为20多天。当然也有很快的隔天收录。
1.下载器发现URL地址。当一个页面被搜索引擎收录,蜘蛛会定期来此页面回访。
2.蜘蛛会对URL发出Get请求,3,服务器收到GET请求返回数据。

<html>
<head>
tuniu
</head>

<body>
....
</body>
</html>

对数据进行对应编码;进入【A类处理】【B类处理】并行处理。
是gb2312,还是utf-8进行辨别。
<meta http-equiv="content-type" content="text/html; charset=UTF-8" />



您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|Archiver|Baidu Inc.

GMT+8, 2020-10-28 08:57 , Processed in 0.245094 second(s), 16 queries .

Powered by Discuz! X3.2

© 2001-2011 Comsenz Inc.

返回顶部