cURL 是一个利用URL语法规定来传输文件和数据的工具。php也支持cURL库。
cURL就是模拟浏览器来传输数据。支持很多协议,如FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP等协议。
包括:
HTTPS认证,HTTP POST方法,HTTP PUT方法,FTP上传,keyberos认证,HTTP上传,代理服务器,cookies,用户名/密码认证,下载文件断点续传,上传文件断点续传,http代理服务器管道,IPv6,scoket5代理服务器。
完成一个请求需要四步骤:
1.初始化,创建cURL资源
2.设置URL和相应的选项
3.抓取URL并把它传递给浏览器
4.关闭cURL资源,释放系统资源
采集一个网页,一般的,大家都很熟悉使用file_get_contents()函数来获取采集网页内容。
$str = file_get_contents('http://taizidian.cn');
或者
$str = readfile("http://taizidian.cn");
然而使用cURL可以进行错误处理,完成更复杂的任务,如处理cookies,验证,表单提交,文件上传......
使用cURL来完成采集网页的四步骤:
//1.初始化,创建一个新cURL资源 $page = curl_init(); //2.设置URL和相应的选项 curl_setopt($page, CURLOPT_URL, "http://taizidian.cn/"); curl_setopt($page, CURLOPT_HEADER, 0);//启用时会将头文件的信息作为数据流输出 //3.抓取URL并把它传递给浏览器 curl_exec($page); //4.关闭cURL资源,并且释放系统资源 curl_close($page);
关键的是第二步骤,可以设置一些高级选项。详见:curl_setopt()函数的一些参数
- 我的微信
- 这是我的微信扫一扫
- 我的微信公众号
- 我的微信公众号扫一扫