利用php抓取蜘蛛爬虫痕迹的示例代码-侯体宗的博客

利用php抓取蜘蛛爬虫痕迹的示例代码
php / 管理员发布于 8年前 438

前言

相信许多的站长、博主可能最关心的无非就是自己网站的收录情况，一般情况下我们可以通过查看空间服务器的日志文件来查看搜索引擎到底爬取了我们哪些个页面，不过，如果用php代码分析web日志中蜘蛛爬虫痕迹，是比较好又比较直观方便操作的！下面是示例代码，有需要的朋友们下面来一起看看吧。

示例代码

 'googlebot',          'Baidu'    => 'baiduspider',          'Yahoo'    => 'yahoo slurp',          'Soso'    => 'sosospider',          'Msn'    => 'msnbot',          'Altavista'  => 'scooter ',          'Sogou'    => 'sogou spider',          'Yodao'    => 'yodaobot'      );  $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);  foreach ($bots as $k => $v){    if (strstr($v,$userAgent)){      return $k;      break;    }  }  return false;} //获取哪种蜘蛛爬虫后保存蜘蛛痕迹。//根据采集时HTTP_USER_AGENT是否为空来防止采集//抓蜘蛛爬虫$spi  = isSpider();if($spi){  $tlc_thispage  = addslashes($_SERVER['HTTP_USER_AGENT']);  $file      = 'robot.txt';  $time      = date('Y-m-d H:i:s',mktime());  $handle      = fopen($file,'a+');  $PR        = $_SERVER['REQUEST_URI'];  fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} \n\r");  fclose($handle);}?>

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有问题大家可以留言交流。

您可能感兴趣的文章:

PHPCrawl爬虫库实现抓取酷狗歌单的方法示例
php与python实现的线程池多线程爬虫功能示例
PHP+HTML+JavaScript+Css实现简单爬虫开发
php实现简单爬虫的开发
PHP代码实现爬虫记录――超管用
PHP实现简单爬虫的方法
一个PHP实现的轻量级简单爬虫
php 向访客和爬虫显示不同的内容
php IIS日志分析搜索引擎爬虫记录程序
PHP一个简单的无需刷新爬虫

上一条：
php实现基于openssl的加密解密方法
下一条：
php通过执行CutyCapt命令实现网页截图的方法

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

相关文章
Laravel从Accel获得5700万美元A轮融资(0个评论)
PHP 8.4 Alpha 1现已发布！(0个评论)
用Time Warden监控PHP中的代码处理时间(0个评论)
在PHP中使用array_pop + yield实现读取超大型目录功能示例(0个评论)
Property Hooks RFC在PHP 8.4中越来越接近现实(0个评论)

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top