Bootstrap

curl通信使用:参数设置和调试及断点续传下载

/**

    * @author wangdaopo

    * @email [email protected]

    */

一、利用libcurl完成传输任务的流程

二、CURLcode curl_easy_setopt(CURL *handle, CURLoption option,parameter);

三、注意:

四、实例LibCurl调试实例

 

官网:https://curl.haxx.se/libcurl/

简介:为什么要使用libcurl,(1)作为http的客户端,可以直接用socket连接服务器,然后对到的数据进行http解析,但要分析协议头,实现代理…这样太麻烦了。#也就是socket连接然后发post、get协议包,自己组包和拆包。(2)libcurl是一个开源的客户端url传输库,支持FTP,FTPS,TFTP,HTTP,HTTPS,GOPHER,TELNET,DICT,FILE和LDAP,支持Windows,Unix,Linux等平台,简单易用,且库文件占用空间不到200K。

Libcurl的所有接口被设计成线程安全(线程安全的意思是:在多线程之中可以同时调用一个API而不会互相影响,也就是函数可重入),另外要特别注意的是,任何一个libcurl的handle都不应该在多个线程之间共享,另外若使用HTTPS、FTPS需要OpenSSL或GnuTls的支持。

Libcurl提供三种handle:easy_handle、multi_handle、share_handle

    easy_handle:为libcurl的最基础部分,所有的操作都是在easy_handle上进行的,比如发送、请求数据都是在其上进行的。如果直接在easy_handle执行操作 curl_easy_perform 函数是阻塞的(即需要等到完成才返回)

    multi_handle:libcurl为异步操作提供的接口,允许调用方在一个线程中处理多个操作(就是easy_handle上的操作,注意是单线程下的),内部multi_handle采用堆栈的方式保存多个easy_handle,然后在一个线程中可以同时对多个easy_handle进行处理,multi_handle的执行操作 curl_multi_perform 函数是立即返回的,不会阻塞

    share_handle:有时候多个easy_handle需要分享一些信息,比如cookie,当一个连接获取一个新的cookie,就可以将这个cookie共享到所有的连接上

一、利用libcurl完成传输任务的流程

easy interface使用方法

1. 调用curl_global_init()初始化libcurl

2. 调用curl_easy_init()函数得到 easyinterface型指针

3. 调用curl_easy_setopt()设置传输选项

4. 根据curl_easy_setopt()设置的传输选项,实现回调函数以完成用户特定任务  在整过过程中设置curl_easy_setopt()参数是最关键的,几乎所有的libcurl程序都要使用它。

5. 调用curl_easy_perform()函数完成传输任务 

6. 调用curl_easy_cleanup()释放内存

在整过过程中设置curl_easy_setopt()参数是最关键的,几乎所有的libcurl程序都要使用它。

 

multi interface使用方法

multi interface的使用是在easy interface的基础之上,将多个easy handler加入到一个stack中,同时发送请求。与easy interface不同,它是一种异步,非阻塞的传输方式。

在掌握easy interface的基础上,multi interface的使用也很简单:
1)curl_multi _init初始化一个multi handler对象,
2)初始化多个easy handler对象,使用curl_easy_setopt进行相关设置,
3)调用curl_multi _add_handle把easy handler添加到multi curl对象中
4)添加完毕后执行curl_multi_perform方法进行并发的访问,
5)访问结束后curl_multi_remove_handle移除相关easy curl对象,先用curl_easy_cleanup清除easy handler对象,最后curl_multi_cleanup清除multi handler对象。
 

      等待及超时  

        int numfds = 0; 
        long timeout_ms = CURL_WAIT_TIMEOUT_MSECS; 
        curl_multi_timeout(multi handler, &timeout_ms);//get timeout ms instead 
        CURLMcode retcode = curl_multi_wait(multi handler, NULL, 0, timeout_ms, &numfds); 
        if (retcode != CURLM_OK) { 
            printf("ERROR----curl_multi_wait  errorcode[%d]\n",retcode);           
            break; 
     } 

二、CURLcode curl_easy_setopt(CURL *handle, CURLoption option,parameter);

描述: 这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)参数:

1 CURL类型的指针

2 各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)

3 parameter 这个参数既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.

CURLoption 这个参数的取值很多.具体的可以查看man手册.

 

URLcode curl_easy_perform(CURL *handle);

描述:这个函数在初始化CURL类型的指针以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的option 运作起来.参数:

CURL类型的指针.

 

curl_easy_setopt函数部分选项介绍  https://curl.haxx.se/libcurl/c/curl_easy_setopt.html

1. CURLOPT_URL 设置访问URL

2. CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA

回调函数原型为:size_t function(void *ptr, size_t size, size_t nmemb, void *stream);函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。CURLOPT_WRITEDATA用于表明CURLOPT_WRITEFUNCTION函数中的stream指针的来源。

如果你没有通过CURLOPT_WRITEFUNCTION属性给easy handle设置回调函数,libcurl会提供一个默认的回调函数,它只是简单的将接收到的数据打印到标准输出。你也可以通过CURLOPT_WRITEDATA属性给默认回调函数传递一个已经打开的文件指针,用于将数据输出到文件里。

3. CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA

回调函数原型为 size_tfunction( void *ptr, size_t size,size_t nmemb, void *stream); libcurl一旦接收到http 头部数据后将调用该函数。CURLOPT_WRITEDATA传递指针给libcurl&

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;