Bootstrap

SDP协议详细总结

一 概述:

        SDP目的就是在媒体会话中,传递媒体流信息,允许会话描述的接收者去参与会话。SDP基本上在internet上工作。他定义了会话描述的统一格式,但并不定义多播地址的分配和SDP消息的传输,也不支持媒体编码方案的协商,这些功能均由下层传送协议完成。典型的会话传送协议包括:SAP(Session Announcement Protocol会话公告协议),SIP(Session Initiation Protocol,会话初始协议),RTSP,HTTP,和使用MIME的E-Mail。

SDP包括以下一些方面:

(1)会话的名称和目的

(2)会话存活时间

(3)包含在会话中的媒体信息,包括:

媒体类型(video,audio, etc)

传输协议(RTP/UDP/IP,H.320, etc)

媒体格式(H.261video, MPEG video, etc)

多播或远端(单播)地址和端口

(4)为接收媒体而需的信息(addresses, ports, formats and so on)

(5)使用的带宽信息

(6)可信赖的接洽信息(Contact information)


二 sdp规格:


SDP会话描述由多行<type>=<value>组成。其中<type>是一个字符。<value>是一个字符串,其格式视<type>而定。整个协议区分大小写。“=”两侧不允许有空格。

SDP会话描述由一个会话级描述(session_level description)和多个媒体级描述(media_level description)组成。会话级(session_level)的作用域是整个会话。其位置是从’v=’行开始到第一个媒体描述为止。媒体级(media_level)描述是对单个的媒体流进行描述(例如传送单个音频或者视频的vlc sdp文件只有短短的几句话,从m=开始,这其实就是个媒体机描述),其位置是从’m=’行开始到下一个媒体描述为止。总之,除非媒体部分重载,会话级的值是各个媒体的缺省默认值(就是说媒体级描述其实也是一个会话级描述,只不过没写出来的会话级描述参数都用的缺省值)。

SDP的结构如下:

Sessiondescription

        v=  (protocol version)

        o= (owner/creator and session identifier).

        s= (session name)

        i=* (session information)

        u=* (URI of description)

        e=* (email address)

        p=* (phone number)

        c=* (connection information - notrequired if included in all media)

        b=* (bandwidth information)

        One or more time descriptions (seebelow)

        z=* (time zone adjustments)

        k=* (encryption key)

        a=* (zero or more session attributelines)

        Zero or more media descriptions (seebelow)

 

Time description

       t=  (time the session is active)

        r=* (zero or more repeat times)

 

Media description

        m= (media name and transport address)

        i=* (media title)

        c=* (connection information - optionalif included at session-level)

        b=* (bandwidth information)

        k=* (encryption key)

        a=* (zero or more media attributelines)

    上面的有些行是必需有的,有些行是可选的。可选的行有*号标记。必需的是v,o,s,t,m(这是对于会话级描述和媒体及描述总体而言的,对于媒体级描述而言只有m=是必须的)。注意所有的描述项必须按照上面的顺序给出。


三 各个字段的描述:

1.Version(必选)

v=0

       SDP的版本号,不包括次版本号。

2.origion(必选)

o=<username> <sessionid> <version> <network type> <address type> <address>

 o=<用户名> <session id> <会话版本> <网络类型><地址类型> <地址>

 “o=”项对会话的发起者进行了描述。

<username>是用户的登录名。如果主机不支持<username>,则为 ”-”。注意:<username>不能含空格。

     <session id>:是一个数字串。在整个会话中,必须是唯一的。为了确保其唯一,建议使用NTP(Network Time Protocol)timestamp。

<version>:该会话公告的版本,供公告代理服务器检测同一会话的若干个公告哪个是最新公告.基本要求是会话数据修改后该版本值递增,建议用NTP时戳。

     <networktype>:网络类型,一般为”IN”,表示”internet”

     <address type>:地址类型,一般为IP4

     <address>:地址

3.Session Name(必选)

 s=<sessionname>

 会话名,在整个会话中有且只有一个”s=”。

4.Connection Data(可选)

 c=<networktype> <address type> <connection address>

     表示媒体连接信息。

     一个会话声明中,会话级描述中必须有”c=”项或者在每个媒体级描述中有一个”c=”项。可能在会话级描述和每个媒体级描述中都有”c=”项。

     <network type>:网络类型,一般为”IN”,表示”internet”

     <address type>:地址类型,一般为IP4。

     <connection address>:应用程序必须处理域名和ip地址两种情形。单播时,为域名或ip地址,推荐使用域名;多播,为ip地址,且ip后面必须有TTL(取值范围是0-255),地址和TTL决定了多播包被传播的范围。例:

c=IN IP4 224.2.1.1/127

    分层编码方案是一个数据流被分为多层,接受者能够通过申请不同层的流选择流的质量(包括带宽)如下:

<base multicastaddress>/<ttl>/<number of addresses>

如果<number of addresses>没有给定,则默认为1。

  c=INIP4 224.2.1.1/127/3

等价于:

c=IN IP4 224.2.1.1/127

c=IN IP4 224.2.1.2/127

c=IN IP4 224.2.1.3/127

 5.Bandwidth(可选)

      b=<modifier>:<bandwidth-value>

      描述了建议的带宽,单位kilobits per second,可选。

<modifier>:包括两种CT和AS。CT:ConferenceTotal,总带宽。AS:Application-SpecificMaximum,单个媒体带宽的最大值。

扩展机制:<modifier>以”X-”开始。建议modifier越短越好。例

b=X-YZ:128

 

6.Times(必选), RepeatTimesand Time Zones

     t=<start time>  <stop time>

     描述了会话的开始时间和结束时间。

     <start time> 和<stop time> 为NTP时间,单位是秒。假如<stop time>为零表示过了<start time>时间后会话一直持续。当<start time> 和<stoptime>均为零时表示持久会话。

     建议start time和stoptime不要设为0。因为不知道此会话的开始和结束时间,增加了调度(scheduling)的难度。

7.Media Announcements (必选)

    m=<media><port> <transport> <fmt list>

    一个会话描述包括几个媒体描述。一个媒体描述以”m=”开始到下一个”m=”结束。

    <media>:表示媒体类型。有"audio", "video","application"(例白板信息), "data"(不向用户显示的数据) 和"control"(描述额外的控制通道)。

   <port>:媒体流发往传输层的端口。取决于c=行规定的网络类型和接下来的传送层协议:对UDP为1024-65535;对于RTP为偶数。当分层编码流被发送到一个单播地址时,需要列出多个端口。方式如下:

m=<media><port>/<number of ports> <transport> <fmt list>

对于RTP,偶数端口被用来传输数据,奇数端口用来传输RTCP包。例:

m=video49170/2 RTP/AVP 31

端口49170和49171为第一对RTP/RTCP端口,49172和49173为第二对的端口。传输协议是RTP/AVP,媒体格式为31(媒体格式是rtp头中payload参数对应的)。

    <transport>:传输协议,与c=行的地址类型有关。两种: RTP/AVP,表示RealtimeTransport Protocol using the Audio/Video profile carried over UDP;UDP。

<fmt list>:媒体格式。对于音频和视频就是在RTP Audio/Video Profile定义的负载类型(payload type)。但第一个为缺省值,分为静态绑定和动态绑定:静态绑定即媒体编码方式与RTP负载类型有确定的一一对应关系,动态绑定即媒体编码方式(如时钟频率,音频信道数等)没有完全确定,需要进一步的属性说明(用rtpmap)。分别举例如下,静态绑定的例子:u_law的PCM编码单信道Audio,采样率8KHZ。在RTPAudio/Video profile中对应的payload type为0。即:

m=audio49232 RTP/AVP 0

动态绑定的例子:16位线形编码,采样率为16KHZ,假如我们希望动态RTP/AVP 类型98表示此此流,写法如下:

 m=video49232 RTP/AVP 98

a=rtpmap:98 L16/16000/2

 

8.rtpmap(可选)

a=rtpmap:<payload type><encoding name>/<clock rate>[/<encodingparameters>]

a=rtpmap:<负载类型><编码名>/<时钟速率>[/<编码参数>]

对于音频流,<编码参数>说明了音频的通道数。通道数默认缺省值为1。对于视频流,现阶段没有<编码参数>。

                             

                  m=audio 49230 RTP/AVP 96 97 98          m=audio 8888 RTP/AVP 0     m=video 1234 RTP/AVP 96

                  a=rtpmap:96 L8/8000                               a=rtpmap:0 pcma/8000/1        a=rtpmap:96 H264

                  a=rtpmap:97 L16/8000

                  a=rtpmap:98 L16/11025/2

   在rtpmap中,实验性的编码方案也可以用。其格式名前一定为”X-”例:一种新的实验性的被称为GSMLPC的音频流,使用的动态负载类型为99。

m=video 49232 RTP/AVP 99

                             a=rtpmap:99 X-GSMLPC/8000

9.SuggestedAttributes(可选)

    a=<TYPE>或 a=<TYPE>:<VALUES>

a=framerate:<帧速率>//单位:帧/秒        1s播放几个rtp包  倒数为一个rtp包承载的数据播放的时间单位s

                                    音频的话       a=framerate:50        1byte*8000hz*20ms=160B

                                    则每个rtp包的音频数据量为160B  时间戳增值为160

a=lang:<语言标记>//会话描述的缺省语言或媒体描述的语言


注:  如果SDP语法分析器不能识别某一类型(Type),则整个描述丢失。

       如果”a=”的某属性值不理解,则予以丢失属性。

       会话级的描述就是媒体级描述的缺省值(就是说媒体级描述其实也是一个会话级描述,只不过没写出来的会话级描述参数都用的缺省值)。


四 举例:

1.媒体级会话VLC播放264视频的sdp文件

m=video 1234 RTP/AVP 96
a=rtpmap:96 H264
a=framerate:15
c=IN IP4 172.18.168.45

详细:http://blog.csdn.net/zhangjikuan/article/details/27378237

2.媒体级会话VLC播放g711音频的sdp文件

m=audio 8888 RTP/AVP 0   
a=rtpmap:0 pcma/8000/1                          这地方是a率压缩方式;pcmu就是u率型
a=framerate:25                                 8000/25=320Byte    每个rtp包的音频数据为320byte   时间戳增值为320
c=IN IP4 192.168.1.230

详细:http://blog.csdn.net/zhangjikuan/article/details/27379201

如果是同时播放音频和视频流只要把这两个媒体级会话合在一个sdp文件中就好了

3.点播mp4文件,MS_H返回给终端的sdp信息

v=0

o=HWPSS 3427743244 1084119141 IN IP4 127.0.0.1

s=test1.mp4

test1.mp4:媒体文件名

c=IN IP4 0.0.0.0

t=0 0

a=control:*

a=range:npt=0-44.000000

44.000000mvhd原子:ntohl (movie_header->duration)/ ntohl(movie_header->time_scale)

 

m=video 0 RTP/AVP 96

96track->payload_type     视频:96音频:97

a=control:trackID=101

101:轨道ID 视频:101102 103 音频: 201202 203204 205

a=rtpmap:96 MP4V-ES/90000

90000track->time_scale

a=fmtp:96 profile-level-id=2;config=000001b0020;

profile-level-id=2   mp4v的子原子esds中得来

config=000001b0020 mp4v的子原子esds中得来

 

m=audio 0 RTP/AVP 97

a=control:trackID=201

a=rtpmap:97 mpeg4-generic/24000/1

24000 track->time_scale

1mp4a的子原子esds中得来的

a=fmtp:97 streamtype=5;profile-level-id=15; mode=AAC-hbr; config=1308; SizeLength=13; IndexLength=3;IndexDeltaLength=3; Profile=1;

config=1308mp4a的子原子esds中得来的

streamtype=5; profile-level-id=15; mode=AAC-hbr:写死

SizeLength=13; IndexLength=3; IndexDeltaLength=3; Profile=1:写死

  

4.直播

编码器生成的sdp文件

v=0

o=- 2545495921 1885424500 IN IP4 192.168.225.158

s=111

c=IN IP4 192.168.225.153

b=RR:0

t=0 0

 

m=video 5088RTP/AVP 96

b=AS:949

a=rtpmap:96 H264/90000

a=fmtp:96 profile-level-id=4D4015;sprop-parameter-sets=Z01AFZZWCwSbCEiAAAH0AAAw1DBgAHP2AOg1cABQ,aO88gA==;packetization-mode=1

a=cliprect:0,0,576,352

a=framerate:25.

a=mpeg4-esid:201

a=x-envivio-verid:0002229D

 

m=audio 5090 RTP/AVP 97

b=AS:50

a=rtpmap:97 mpeg4-generic/24000/2

a=fmtp:97 profile-level-id=15; config=1310;streamtype=5; ObjectType=64; mode=AAC-hbr; SizeLength=13; IndexLength=3;IndexDeltaLength=3

a=mpeg4-esid:101

a=lang:eng

a=x-envivio-verid:0002229D

 

点播上面的sdp文件,MS_H传给终端的sdp信息

v=0

MS_H全部是写死的

 

 

o=- 1702415089 4281335390 IN IP4 127.0.0.1

s=live

c=IN IP4 0.0.0.0

t=0 0

a=control:*

a=range:npt=0-

 

m=video 5088 RTP/AVP 96

b=AS:949

a=rtpmap:96 H264/90000

a=fmtp:96 profile-level-id=4D4015;sprop-parameter-sets=Z01AFZZWCwSbCEiAAAH0AAAw1DBgAHP2AOg1cABQ,aO88gA==;packetization-mode=1

a=cliprect:0,0,576,352

a=framerate:25.

a=mpeg4-esid:201

a=x-envivio-verid:0002229D

a=control:trackID=103

此媒体描述是与编码器的媒体描述是一样的。

 

m=audio 5090 RTP/AVP 97

b=AS:50

a=rtpmap:97 mpeg4-generic/24000/2

a=fmtp:97 profile-level-id=15; config=1310;streamtype=5; ObjectType=64; mode=AAC-hbr; SizeLength=13; IndexLength=3;IndexDeltaLength=3

a=mpeg4-esid:101

a=lang:eng

a=x-envivio-verid:0002229D

a=control:trackID=201

此媒体描述是与编码器的媒体描述是一样的。




     SDP 完全是一种会话描述格式 ― 它不属于传输协议 ― 它只使用不同的适当的传输协议,包括会话通知协议(SAP)、会话初始协议(SIP)、实时流协议(RTSP)、MIME 扩展协议的电子邮件以及超文本传输协议(HTTP)

  • SDP 文本信息包括:
会话名称和意图; 
会话持续时间; 
构成会话的媒体; 
有关接收媒体的信息(地址等)。
  • 协议结构
  SDP 信息是文本信息,采用 UTF-8 编 码中的 ISO 10646 字符集。SDP 会话描述如下:(标注 * 符号的表示可选字段): 

  v = (协议版本) 

  o = (所有者/创建者和会话标识符) 

  s = (会话名称) 

  i = * (会话信息) 

  u = * (URI 描述) 

  e = * (Email 地址) 

  p = * (电话号码) 

  c = * (连接信息 ― 如果包含在所有媒体中,则不需要该字段) 

  b = * (带宽信息)
一个或更多时间描述
  (如下所示):

  z = * (时间区域调整) 

  k = * (加密密钥) 

  a = * (0 个或多个会话属性行) 

  0个或多个媒体描述(如下所示) 时间描述

  t = (会话活动时间) 

  r = * (0或多次重复次数)
媒体描述
  m = (媒体名称和传输地址) 

  i = * (媒体标题) 

  c = * (连接信息 — 如果包含在会话层则该字段可选) 

  b = * (带宽信息) 

  k = * (加密密钥) 

  a = * (0 个或多个会话属性行)   



悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;