您好,欢迎访问一九零五行业门户网

CURL与PHP-CLI的应用【CURL篇】

curl是一个极为强大的http传输工具,支持文件的上传和下载;
curl在命令行下的使用命令参数-a/--append 上传文件时,附加到目标文件 -a/--user-agent设置用户代理发送给服务器 - anyauth   可以使用“任何”身份验证方法 -b/--cookiecookie字符串或文件读取位置 - basic 使用http基本验证 -b/--use-ascii 使用ascii /文本传输 -c/--cookie-jar操作结束后把cookie写入到这个文件中 -c/--continue-at断点续转 -d/--datahttp post方式传送数据 --data-ascii以ascii的方式post数据 --data-binary以二进制的方式post数据 --negotiate     使用http身份验证 --digest        使用数字身份验证 --disable-eprt  禁止使用eprt或lprt --disable-epsv  禁止使用epsv -d/--dump-header把header信息写入到该文件中 --egd-file为随机数据(ssl)设置egd socket路径 --tcp-nodelay   使用tcp_nodelay选项 -e/--referer 来源网址 -e/--cert客户端证书文件和密码 (ssl) --cert-type证书文件类型 (der/pem/eng) (ssl) --key私钥文件名 (ssl) --key-type私钥文件类型 (der/pem/eng) (ssl) --pass私钥密码 (ssl) --engine加密引擎使用 (ssl). --engine list for list --cacertca证书 (ssl) --capathca目录 (made using c_rehash) to verify peer against (ssl) --ciphersssl密码 --compressed    要求返回是压缩的形势 (using deflate or gzip) --connect-timeout设置最大请求时间 --create-dirs   建立本地目录的目录层次结构 --crlf          上传是把lf转变成crlf -f/--fail          连接失败时不显示http错误 --ftp-create-dirs 如果远程目录不存在,创建远程目录 --ftp-method [multicwd/nocwd/singlecwd] 控制cwd的使用 --ftp-pasv      使用 pasv/epsv 代替端口 --ftp-skip-pasv-ip 使用pasv的时候,忽略该ip地址 --ftp-ssl       尝试用 ssl/tls 来进行ftp数据传输 --ftp-ssl-reqd  要求用 ssl/tls 来进行ftp数据传输 -f/--form模拟http表单提交数据 -form-string模拟http表单提交数据 -g/--globoff 禁用网址序列和范围使用{}和[] -g/--get 以get的方式来发送数据 -h/--help 帮助 -h/--header自定义头信息传递给服务器 --ignore-content-length  忽略的http头信息的长度 -i/--include 输出时包括protocol头信息 -i/--head  只显示文档信息 从文件中读取-j/--junk-session-cookies忽略会话cookie - 界面指定网络接口/地址使用 - krb4 启用与指定的安全级别krb4 -j/--junk-session-cookies 读取文件进忽略session cookie --interface使用指定网络接口/地址 --krb4使用指定安全级别的krb4 -k/--insecure 允许不使用证书到ssl站点 -k/--config  指定的配置文件读取 -l/--list-only 列出ftp目录下的文件名称 --limit-rate设置传输速度 --local-port强制使用本地端口号 -m/--max-time设置最大传输时间 --max-redirs设置最大读取的目录数 --max-filesize设置最大下载的文件总量 -m/--manual  显示全手动 -n/--netrc 从netrc文件中读取用户名和密码 --netrc-optional 使用 .netrc 或者 url来覆盖-n --ntlm          使用 http ntlm 身份验证 -n/--no-buffer 禁用缓冲输出 -o/--output 把输出写到该文件中 -o/--remote-name 把输出写到该文件中,保留远程文件的文件名 -p/--proxytunnel   使用http代理 --proxy-anyauth 选择任一代理身份验证方法 --proxy-basic   在代理上使用基本身份验证 --proxy-digest  在代理上使用数字身份验证 --proxy-ntlm    在代理上使用ntlm身份验证 -p/--ftp-port使用端口地址,而不是使用pasv -q/--quote文件传输前,发送命令到服务器 -r/--range检索来自http/1.1或ftp服务器字节范围 --range-file 读取(ssl)的随机文件 -r/--remote-time   在本地生成文件时,保留远程文件时间 --retry传输出现问题时,重试的次数 --retry-delay传输出现问题时,设置重试间隔时间 --retry-max-time传输出现问题时,设置最大重试时间 -s/--silent静音模式。不输出任何东西 -s/--show-error   显示错误 --socks4用socks4代理给定主机和端口 --socks5用socks5代理给定主机和端口 --stderr-t/--telnet-optiontelnet选项设置 --trace对指定文件进行debug --trace-asciilike --跟踪但没有hex输出 --trace-time    跟踪/详细输出时,添加时间戳 -t/--upload-file上传文件 --urlspet url to work with -u/--user设置服务器的用户和密码 -u/--proxy-user设置代理用户名和密码 -v/--verbose -v/--version 显示版本信息 -w/--write-out [format]什么输出完成后 -x/--proxy在给定的端口上使用http代理 -x/--request指定什么命令 -y/--speed-time 放弃限速所要的时间。默认为30 -y/--speed-limit 停止传输速度的限制,速度时间'秒' -z/--time-cond  传送时间设置 -0/--http1.0  使用http 1.0 -1/--tlsv1  使用tlsv1(ssl) -2/--sslv2 使用sslv2的(ssl) -3/--sslv3         使用的sslv3(ssl) --3p-quote      like -q for the source url for 3rd party transfer --3p-url        使用url,进行第三方传送 --3p-user       使用用户名和密码,进行第三方传送 -4/--ipv4   使用ip4 -6/--ipv6   使用ip6 -#/--progress-bar 用进度条显示当前的传送状态
实例抓取页面内容到一个文件中
curl -o home.html  http://www.pinlehuo.com  $ -o/--output 把输出写到该文件中 # 或者 ↓↓ $ curl http://www.linuxidc.com > page.html
抓具体的文件,用-o(大写的),后面的url要具体到某个文件,不然抓不下来。我们还可以用正则来抓取东西,但文件名还是得具体
$ curl -o www.pinlehuo.com/d/file/admin/2015/05/5551bf06428ec.jpg $ curl -o http://www.codesky.net/wp-content/uploads/2010/[0-9][0-9]/aaaaa.jpg
模拟表单信息,模拟登录,保存cookie信息
# -d/--dump-header把header信息写入到该文件中 $ curl -c ./cookie_c.txt -f log=aaaa -f pwd=****** http://www.codesky.net/wp-login.php (没试过~)
查看响应头信息
curl -i http://www.sunrisecorp.net/
模拟表单信息,模拟登录,保存头信息
curl -d ./cookie_d.txt -f log=aaaa -f pwd=****** http://www.codesky.net/wp-login.php # -c(小写)产生的cookie和-d里面的cookie是不一样的。
使用cookie文件
curl -b ./cookie_c.txt  http://www.codesky.net/wp-admin
断点续传,-c(大写的)
curl -c -o http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg
传送数据,最好用登录页面测试,因为你传值过去后,curl回抓数据,你可以看到你传值有没有成功
curl -d log=aaaa  http://www.codesky.net/wp-login.php
伪造来源地址,有的网站会判断,请求来源地址
curl -e http://localhost http://www.codesky.net/wp-login.php
当我们经常用curl去搞人家东西的时候,人家会把你的ip给屏蔽掉的,这个时候,我们可以用代理
curl -x 24.10.28.84:32779 -o home.html http://www.codesky.net
比较大的东西,我们可以分段下载
[root@krlcgcms01 mytest]# curl -r 0-100 -o img.part1 http://www.codesky.net/wp- content/uploads/2010/09/compare_varnish.jpg  % total    % received % xferd  average speed   time    time     time  current  dload  upload   total   spent    left  speed 100   101  100   101    0     0    105      0 --:--:-- --:--:-- --:--:--     0 [root@krlcgcms01 mytest]# curl -r 100-200 -o img.part2 http://www.codesky.net/wp- content/uploads/2010/09/compare_varnish.jpg  % total    % received % xferd  average speed   time    time     time  current  dload  upload   total   spent    left  speed 100   101  100   101    0     0     57      0  0:00:01  0:00:01 --:--:--     0 [root@krlcgcms01 mytest]# curl -r 200- -o img.part3 http://www.codesky.net/wp- content/uploads/2010/09/compare_varnish.jpg  % total    % received % xferd  average speed   time    time     time  current  dload  upload   total   spent    left  speed 100  104k  100  104k    0     0  52793      0  0:00:02  0:00:02 --:--:-- 88961 [root@krlcgcms01 mytest]# ls |grep part | xargs du -sh 4.0k    one.part1 112k    three.part3 4.0k    two.part2 用的时候,把他们cat一下就ok了,cat img.part* >img.jpg
显示下载进度信息
[root@krlcgcms01 mytest]# curl -# -o  http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg ######################################################################## 100.0%
通过ftp下载文件
[zhangy@blackghost ~]$ curl -u 用户名:密码 -o http://www.codesky.net/demo/curtain/bbstudy_files/style.css  % total    % received % xferd  average speed   time    time     time  current  dload  upload   total   spent    left  speed 101  1934  101  1934    0     0   3184      0 --:--:-- --:--:-- --:--:--  7136 或者用下面的方式 [zhangy@blackghost ~]$ curl -o ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/style.css
通过ftp上传
[zhangy@blackghost ~]$ curl -t test.sql ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/
curl在php脚本下的使用安装curl库wamp环境
分别打开以下 2 个文件:
wamp\bin\php(your php version)\php.ini
wamp\bin\apache(your apache version)\bin\php.ini
搜索 extension=php_curl.dll ,然后删除前面的符号 ;
重启wamp 即可。
//↑↑先按照以上的操作,如果不行,再参考以下两个;
注:如果是64位的系统,还需要访问 http://www.anindya.com/ 下载对应版本的64位php压缩包,解压后,将 ext 目录下 的 php_curl.dll 覆盖 wamp php对应版本 wamp\bin\php\php5.4.12\ext 目录下的 php_curl.dll 文件,然后重启wamp
参考网站:http://blog.csdn.net/ewili/article/details/9008493
window
1.php.ini把前面的extension=php_curl.dll分号去掉;
2.php_curl.dll,libeay32.dll,ssleay32.dll 复制到 %windir%/system32下
linux
如果php已经在系统编译好,后来又需要添加新的扩展。一种方式就是重新完全编译php,另一种方式就是单独编译扩展库,以extension的形式扩展。下面以安装curl扩展为例:
./configure
make
php要求curl的目录要有include和lib目录,并且include下要有easy.h 和curl.h两个文件,lib下要有libcurl.a。经编译后include下的文件有了,但是lib目录下没有。原来生成到lib/.libs目录下,所以要copy到lib目录
2、进入安装原php的源码目录,
cd ext
cd curl
phpize
./configure --with-curl=dir
make
就会在phpdir/ext/curl/moudles/下生成curl.so的文件。
php中的curl函数库curl_close — 关闭一个curl会话 curl_copy_handle — 拷贝一个curl连接资源的所有内容和参数 curl_errno — 返回一个包含当前会话错误信息的数字编号 curl_error — 返回一个包含当前会话错误信息的字符串 curl_exec — 执行一个curl会话 curl_getinfo — 获取一个curl连接资源句柄的信息 curl_init — 初始化一个curl会话 curl_multi_add_handle — 向curl批处理会话中添加单独的curl句柄资源 curl_multi_close — 关闭一个批处理句柄资源 curl_multi_exec — 解析一个curl批处理句柄 curl_multi_getcontent — 返回获取的输出的文本流 curl_multi_info_read — 获取当前解析的curl的相关传输信息 curl_multi_init — 初始化一个curl批处理句柄资源 curl_multi_remove_handle — 移除curl批处理句柄资源中的某个句柄资源 curl_multi_select — get all the sockets associated with the curl extension, which can then be selected curl_setopt_array — 以数组的形式为一个curl设置会话参数 curl_setopt — 为一个curl设置会话参数 参考网址:http://blog.csdn.net/superbirds/article/details/7532277: curl_setopt 会话参数详解 参考网址:http://www.zhibotie.net/space-1-do-blog-id-71.html curl_version — 获取curl相关的版本信息 curl_init()函数的作用初始化一个curl会话,curl_init()函数唯一的一个参数是可选的,表示一个url地址。 curl_exec()函数的作用是执行一个curl会话,唯一的参数是curl_init()函数返回的句柄。 curl_close()函数的作用是关闭一个curl会话,唯一的参数是curl_init()函数返回的句柄。
普通抓取网页实例
// 1. 初始化 $ch = curl_init(); //$ch = curl_init(http://www.baidu.com/); // 2. 设置选项,包括url curl_setopt($ch, curlopt_url, http://www.baidu.com/);//curlopt_url: 这是你想用php取回的url地址。 你也可以在用curl_init()函数初始化时设置这个选项 curl_setopt($ch, curlopt_returntransfer, 1);//设定是否输出页面内容,这里为0的话,后面就不用echo, 就直接把curl抓回来的内容输出; curl_setopt($ch, curlopt_header, 0);//设定是否显示头信息,为1的时候,就会把响应头信息也给一并输出 // 3. 执行并获取html文档内容 $output = curl_exec($ch); //echo $output;//输出抓回来的网页;如果curl_setopt($ch, curlopt_returntransfer, 0),就不需要此句; // 4. 释放curl句柄 curl_close($ch);
在抓取的基础上判断错误并输出错误,得到抓取过来的页面的信息
// 1. 初始化 $ch = curl_init(); //$ch = curl_init(http://www.baidu.com/); // 2. 设置选项,包括url curl_setopt($ch, curlopt_url, http://www.baidu.com);//curlopt_url: 这是你想用php取回的url地址。 你也可以在用curl_init()函数初始化时设置这个选项 curl_setopt($ch, curlopt_returntransfer, 1);//设定是否输出页面内容,这里为0的话,后面就不用echo, 就直接把curl抓回来的内容输出; curl_setopt($ch, curlopt_header, 0);//设定是否显示头信息,为1的时候,就会把响应头信息也给一并输出 // 3. 执行并获取html文档内容 $output = curl_exec($ch); //echo $output;//输出抓回来的网页;如果curl_setopt($ch, curlopt_returntransfer, 0),就不需要此句; #判断错误并输出错误 if($output === false){ //全等,不能==; 是为了和获取为空字符串分开;    echo curl error: . curl_error($h); //如果获取失败的话,就输出失败原因;但是在有时候却被工信部重定向到114查询; } #得到抓取过来的页面的信息 //$info = curl_getinfo($ch); //print_r($info);//包含了抓取过来的页面的信息 /*   “url” //资源网络地址   “content_type” //内容编码   “http_code” //http状态码   “header_size” //header的大小   “request_size” //请求的大小   “filetime” //文件创建时间   “ssl_verify_result” //ssl验证结果   “redirect_count” //跳转技术     “total_time” //总耗时   “namelookup_time” //dns查询耗时   “connect_time” //等待连接耗时   “pretransfer_time” //传输前准备耗时   “size_upload” //上传数据的大小   “size_download” //下载数据的大小   “speed_download” //下载速度   “speed_upload” //上传速度   “download_content_length”//下载内容的长度   “upload_content_length” //上传内容的长度     “starttransfer_time” //开始传输的时间   “redirect_time”//重定向耗时 */ //echo '获取'. $info['url'] . '耗时'. $info['total_time'] . '秒'; // 4. 释放curl句柄 curl_close($ch);
以上就介绍了curl与php-cli的应用【curl篇】,包括了方面的内容。
其它类似信息

推荐信息