querylist 获取跳转URL(采集器获取点击跳转后的网址)

前言

最近在学习采集器的过程中,有一个下载按钮,是需要点击后才能获取到真实的网址,折腾了许久都没搞定。最后测试到了一种可用方法。

方法

方法一

   $url = 'https://www.xgw4.com/go?_=6d5082111faHR0cHM6Ly9zaGFyZS5mZWlqaXBhbi5jb20vcy9VSEJCUzFlbw%3D%3D';
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
    curl_setopt($ch, CURLOPT_NOBODY, 1);// 不需要页面内容
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);// 不直接输出
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);// 返回最后的Location
    curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');//有时需要这个功能
    curl_setopt($ch, CURLOPT_MAXREDIRS, 3);//限定只能抓取跳转3次以内的网址
    curl_exec($ch);
    $info = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
    curl_close($ch);
    echo $info;

 

方法二

 

 

$ch=  curl_init("http://www.baidu.com");
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_AUTOREFERER, 1);
curl_setopt($ch, CURLOPT_NOBODY, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');//有时需要这个功能
curl_exec($ch);
$aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
curl_close($ch);
echo $aaa;

 

 

版权声明:
作者:小何
链接:https://ligo100.cn/houduanjishu/qita/639.html
来源:小何博客
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
< <上一篇
下一篇>>
文章目录
关闭
目 录