querylist 获取跳转URL(采集器获取点击跳转后的网址)
前言
最近在学习采集器的过程中,有一个下载按钮,是需要点击后才能获取到真实的网址,折腾了许久都没搞定。最后测试到了一种可用方法。
方法
方法一
$url = 'https://www.xgw4.com/go?_=6d5082111faHR0cHM6Ly9zaGFyZS5mZWlqaXBhbi5jb20vcy9VSEJCUzFlbw%3D%3D';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_NOBODY, 1);// 不需要页面内容
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);// 不直接输出
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);// 返回最后的Location
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');//有时需要这个功能
curl_setopt($ch, CURLOPT_MAXREDIRS, 3);//限定只能抓取跳转3次以内的网址
curl_exec($ch);
$info = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
curl_close($ch);
echo $info;
方法二
$ch= curl_init("http://www.baidu.com");
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_AUTOREFERER, 1);
curl_setopt($ch, CURLOPT_NOBODY, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');//有时需要这个功能
curl_exec($ch);
$aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
curl_close($ch);
echo $aaa;
版权声明:
作者:小何
链接:https://ligo100.cn/houduanjishu/qita/639.html
来源:小何博客
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
打赏
![](https://ligo100.cn/wp-content/uploads/2021/05/qq-jie-tu-20210505165730.png)
文章目录
关闭
共有 0 条评论