您好,欢迎访问一九零五行业门户网

IIS日志分析搜索引擎爬虫记录程序

使用注意:
修改iis.php文件中iis日志的绝对路径
例如:$folder=”c:/windows/system32/logfiles/站点日志目录/”; //后面记得一定要带斜杠(/)。
( 用虚拟空间的不懂查看你的站点绝对路径?上传个探针查看!
直接查看法:http://站点域名/iis.php
本地查看法:把日志下载到本地 http://127.0.0.1/iis.php )
注意:
//站点日志目录,注意该目录必须要有站点用户读取权限!
//如果把日志下载到本地请修改143行的网址为您网站的网址,此操作不是必要操作,不影响分析结果。
//修改文件名称iis.php 需要同时修改对应代码 ctrl+h 把 iis.php全部替换成您要修改的文件名 否则程序运行出错。
//如果iis日志文件过大,可能会导致程序超时!同时也不建议大家使用!
以下是php源代码:
=0;$i--)
   {
    $indexstr.=
.date(y-m-d,filectime($folder.$arr_file[$i])).
百度(baidu)
谷歌(google)
雅虎(yahoo)
有道(yodao)
搜搜(soso)
搜狗(sogou)
微软(msn)
;
   }
   }
 closedir($fp);
 $html = indexhtml();
 $copy = mycopy();
 $html = str_replace([showlog],$indexstr,$html);
 $html = str_replace([copy],$copy,$html);
 echo $html;
}else{
  echo 该日志目录不存在或权限不足,请检查设置!;
  exit();
 }
 }elseif ($type==’baiduspider’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’googlebot’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’yahoo’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’yodaobot’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’sosospider’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’sogou’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type==’msnbot’){
  echo show($type,$folder,$showfile,$page,$pagesize);
 }
function show($type,$folder,$showfile,$page,$pagesize)
{
 if ($type==’baiduspider’)
 {
  $title=’百度’;
 }elseif ($type==’googlebot’){
  $title=’谷歌’;
 }elseif ($type==’yahoo’){
  $title=’雅虎’;
 }elseif ($type==’yodaobot’){
  $title=’有道’;
 }elseif ($type==’sosospider’){
  $title=’搜搜’;
 }elseif ($type==’sogou’){
  $title=’搜狗’;
 }elseif ($type==’msnbot’){
  $title=’msn’;
 }
 if ($type&&$folder&&$showfile)
 {
  if(file_exists($folder.$showfile))
  {
  $fp= fopen($folder.$showfile,r);
  }else{
   echo 该日志文件不存在,请检查设置!;
   exit;
  }
  $j=0;
  $y=0;
  $t=0;
  $h=0;
  while (!feof($fp))
  {
   $str = fgets($fp);
    $str =iconv(utf-8,gb2312//ignore,$str);
   if(strpos($str,$type))
   {
    $j++;
    $temp[].=$str;
    $tmpcount = explode( ,$str);
    if ($tmpcount[11]==200)$t++;
    if ($tmpcount[11]==304)$h++;
    if ($tmpcount[11]==404)$y++;
   }
  }
  fclose($fp);
  $count = count($temp);
  if ($page==1)
  {
   $countshow=$count;
   $mynum = $count-$pagesize;
  }else{
   $countshow =$count-($page*$pagesize-$pagesize);
   $mynum = $count-$page*$pagesize;
  }
  $pagecount =ceil(count($temp) / $pagesize);
  if ($page>=$pagecount)
  {
   $mynum = $pagecount;
  }
  $m=0;
  for ($i=$countshow-1;$i>=$mynum;$i--)
  {
   $num = explode( ,$temp[$i]);
            $domain=http://tarr.cn; //网站url 末尾不要带斜杠
    $show.=
.$num[0]. .$num[1].
.$num[9].
.$num[5].
.$num[11].
;
  }
  unset($temp);
  $showpage = 每页 .$pagesize. 条 当前.$page./$pagecount;
  $showpage.=  首页;
  if ($page!=1)
  {
   $showpage.=  上一页;
  }
  if ($page!=$pagecount)
  {
  $showpage.=  下一页;
  $weei =   尾页;
  }
  $showpage.=$weei. ;
  if ($show)
  {
  $html = pagehtml();
  $copy = mycopy();
  $htmltitle = 牛仔iis日志蜘蛛爬行记录分析器 茄咧啡修改版;//请保留,谢谢!
  $html = str_replace([title],$title,$html);
  $html = str_replace([htmltitle],$htmltitle,$html);
  $html = str_replace([show],$show,$html);
  $html = str_replace([count],$j,$html);
  $html = str_replace([page],$showpage,$html);
  $html = str_replace([y],$y,$html);
  $html = str_replace([t],$t,$html);
  $html = str_replace([h],$h,$html);
  $html = str_replace([copy],$copy,$html);
  return $html;
  }
 }
}
function indexhtml()
{
 return ’
牛仔iis日志蜘蛛爬行记录分析器 v1.1
牛仔iis日志蜘蛛爬行记录分析器 茄咧啡修改版
日期
  引擎
[showlog]
[copy]
’;
}
function pagehtml()//============显示模板,标签代替显示内容!
{
 return  ’
[title]蜘蛛爬行分析 - [htmltitle]
返回日志目录 | dj965
[title]蜘蛛爬行分析
本日志[title]蜘蛛共爬行 [count] 次,其中正常 [t] 个,死链 [y] 个,缓存 [h] 个
时间
  蜘蛛ip
  被爬url
  爬行结果
[show]
[page]
[copy]
’;
}
function mycopy()
{
 return ’
注备说明
正常:表示该面页蜘蛛访问正常,并已经下载。爬行状态返回200。
死链:表示蜘蛛访问的面页不存在或链接错误,爬行状态返回404。
缓存:表示蜘蛛之前已经爬过的面页且该面页未更新过,蜘蛛缓存区已存在该文件,不再下载该面页内容。爬行状态返回304。
注意:蜘蛛爬过的面页不一定会放出来,因为蜘蛛爬回去的数据须经过引擎规则筛选后才会放出来,至于详细请查看引擎收录帮助。
程序名称:牛仔iis日志蜘蛛爬行记录分析器 - 茄咧啡修改版 修改者:茄咧啡
*******************************************************
原程序名称:牛仔iis日志蜘蛛爬行记录分析器
原作者:牛仔
qq:172379201
email:17gd$163.com ($转换@)
注意:本程序只供大家学习使用,请勿用作商业用途。
’;
}
?>
其它类似信息

推荐信息