function baiduSpider($url){
$ch = curl_init();
$user_agent = "Baiduspider+(+http://www.baidu.com/search/spider.htm)";//這里模擬的是百度蜘蛛
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_REFERER, $url);//這里寫(xiě)一個(gè)來(lái)源地址,可以寫(xiě)要抓的頁(yè)面的首頁(yè)
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
$temp=curl_exec($ch);
return $temp;
}
php必須開(kāi)啟curl擴(kuò)展,把$url換成可以寫(xiě)要抓的頁(yè)面就可以了
中山php|最優(yōu)網(wǎng)絡(luò) :中山做網(wǎng)站 中山php建站
最優(yōu)良人
2011/08/08 at 09:08
模仿蜘蛛抓取網(wǎng)站內(nèi)容
in: 后端程序