这篇文章主要介绍了shell脚本联合PHP脚本采集网站的pv和alexa排名,本文使用PHP脚本采集alexa网站数据,然后在shell中调用php脚本并输出数据,需要的朋友可以参考下

这是给朋友写的脚本,是做cdn方面的,经常遇见攻击,但是不能一遇见攻击就把域名给封杀,我们可以有选择的进行判断。

这个是php取值alexa值得:

<?php
$yuming = $argv[1];
//获取 alaxe 排名
function getAlexaRank($domain = www.jb51.net)
{
$line = "";
$data = "";
$url = "http://data.alexa.com/data/?cli=10&dat=snba&ver=7.0&url=".$domain;
$fp = fopen($url,"r");
if($fp)
{
while(!feof($fp))
{
$line = fgets($fp);
$data.= $line;
}
$p = xml_parser_create();
xml_parse_into_struct($p,$data,$vals);
xml_parser_free($p);
for($i = 0 ;$i<count($vals);$i++)
{
if($vals[$i]["tag"]=="POPULARITY")
{
return $vals[$i]["attributes"]["TEXT"];
}
}
}
}
echo getAlexaRank($yuming);
?>

这个是用来取pv数值的

<?php
//
//      参数传递指定地址
//
if(empty($argv[1])){
        die('参数错误');
}else{
        $domain = $argv[1];
}
//
//      curl请求
//
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://alexa.cn/api0523.php"); //?
curl_setopt($ch, CURLOPT_POST, 1);
$data['url'] = $domain;
$data['sig'] = 'd665053d27996bc7c72eff5f70d4facc';
$data['keyt'] = '1350970374';
curl_setopt($ch, CURLOPT_COOKIE, 'checkdom='.$domain);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$resp = curl_exec($ch);
curl_close($ch);
$array_div = explode('*', $resp);
$c = count($array_div);
//
//      解析输出
//
for($i=0; $i<$c; $i++){
        if ($i == 10 || $i == 12 || $i ==14){
                $m = $i + 1;
                if($array_div[$i]!="-"){
                        $as = intval( str_replace(',', '', $array_div[$i]) );
                        $ax = intval( str_replace(',', '', $array_div[$m]) );
                        echo $as*3000*$ax;
                        echo "n";
                }else{
                        echo "-";echo "n";
                }
        }
}


进行shell判断:


#!/bin/bash
digstatus=`dig $1 ns|grep IN.*NS.*.$|grep -E "ns1.appleidc.com|ns2.appleidc.com"|wc -l`
[ $digstatus -eq 0 ] && exit
paiming=`php alexa $1`
if [ $paiming -lt 1000 ]
then
echo high
else
echo no high
fi
pv=`php pv $1`
echo "$1 pv num is $pv"

判断出来后,再做什么的,大家可以自己写。  朋友那里是执行一个post表单,在数据库里把域名加个状态值。