说下思路,利用php的curl函数储存cookie,google搜索页面是无法用file_get_connents打开的,必须要完全模拟浏览器才行,百度就不同了,直接用file_get_conntens抓取页面,然后用正则处理下就行了,这里就不列举百度了。
(.*?)!, $v, $title); $num = count($title[1]);
for ($i = 0; $i
if (strstr($title[0][$i], $url_s)) {
$rsstate = true;
$j = $i +1;
$sum = $j + (($page) * 10 - 10);
//echo $contents;
echo 关键字 . $keyword .
. 排名: . '' . $sum . '' . #### . 第 . ''.$page . ''. 页 . 第 .''.$j . ''. 名 . $title[0][$i] .
;
echo . 点击搜索结果 . .
;
echo
; break;
}
}
}
unset ($contents);
if ($rsstate === false) {
ggsearch($url_s, $keyword, ++ $page); //找不到搜索页面的继续往下搜索
}
} else {
echo '关键字' . $keyword . '10页之内没有该网站排名' . '
';
echo
; }
}
if (!empty ($_post['submit'])) {
$time = explode(' ', microtime());
$start = $time[0] + $time[1];
$more_key = trim($_post['textarea']);
$url_s = trim($_post['url']);
if (!empty ($more_key) && !empty ($url_s)) {
/*判断输入字符的规律*/
if (strstr($more_key, \n)) {
$exkey = explode(\n, $more_key);
}
if(strstr($more_key, |)) {
$exkey = explode(|, $more_key);
}
if(!strstr($more_key, \n)&&!strstr($more_key, |)){
$exkey=array($more_key);
}
/*判断是否有www或者http://之类的东西*/
if (count(explode('.', $url_s))
$url = ltrim($url_s, 'http://www');
$url = 'www.' . $url_s;
}
foreach ($exkey as $keyword) {
//$keyword;
ggsearch($url_s, $keyword);
}
$endtime = explode(' ', microtime());
$end = $endtime[0] + $endtime[1];
echo '
'; echo '程序运行时间: ';
echo $end - $start;
//die();
}
}
?>
抓取排名
关键字:
格式例如:keyword1|keyword2|keyword3
或者: keyword1
keyword2
keyword3
url地址:
www.2cto.com
摘自shine的圣天堂-〃敏〃
http://www.bkjia.com/phpjc/478516.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/478516.htmltecharticle说下思路,利用php的curl函数储存cookie,google搜索页面是无法用file_get_connents打开的,必须要完全模拟浏览器才行,百度就不同了,直接用fi...