通信人家园
标题:
移动公司推动webrct接入IMS成为国际标准
[查看完整版帖子]
[打印本页]
时间:
2013-7-31 08:24
作者:
wl5168
标题:
移动公司推动webrct接入IMS成为国际标准
移动公司推动webrct接入IMS成为国际标准。
WebRTC是一项在
浏览器
内部进行实时视频和音频通信的技术,是谷歌2010年以6820万美元收购Global IP Solutions公司而获得的一项技术。[1]
WebRTC实现了基于网页的视频会议,标准是WHATWG 协议,目的是通过
浏览器
提供简单的javascript就可以达到实时通讯(Real-Time Communications (RTC))能力。
WebRTC(Web Real-Time Communication)项目的最终目的主要是让Web开发者能够基于
浏览器
(Chrome\FireFox\...)轻易快捷开发出丰富的实时多媒体应用,而无需下载安装任何插件,Web开发者也无需关注多媒体的数字信号处理过程,只需编写简单的Javascript程序即可实现,W3C等组织正在制定Javascript 标准API,目前是WebRTC 1.0版本,Draft状态;另外WebRTC还希望能够建立一个多互联网浏览器间健壮的实时通信的平台,形成开发者与浏览器厂商良好的生态环境。同时,Google也希望和致力于让WebRTC的技术成为HTML5标准之一,可见Google布局之深远。[2]
WebRTC提供了视频会议的核心技术,包括音视频的采集、编解码、
网络传输
、显示等功能,并且还支持跨平台:windows,linux,mac,android。
编辑本段
架构
WebRTC架构图
架构图颜色标识说明:[3]
(1)紫色部分是Web开发者API层;
(2)蓝色实线部分是面向
浏览器
厂商的API层
(3)蓝色虚线部分
浏览器
厂商可以自定义实现
WebRTC架构组件介绍
(1) Your Web App
Web开发者开发的程序,Web开发者可以基于集成WebRTC的
浏览器
提供的web API开发基于视频、音频的实时通信应用。[2]
(2)
Web API
面向第三方开发者的WebRTC标准API(Javascript),使开发者能够容易地开发出类似于网络
视频聊天
的web应用,最新的标准化进程可以查看
这里
。
这些API可分成Network Stream API、 RTCPeerConnection、Peer-to-peer Data API三类,详细的API说明可以看这里[4]。
Network Stream API
MediaStream:MediaStream用来表示一个媒体数据流。
MediaStreamTrack在浏览器中表示一个媒体源。
RTCPeerConnection
RTCPeerConnection: 一个RTCPeerConnection对象允许用户在两个浏览器之间直接通讯。
RTCIceCandidate :表示一个ICE协议的候选者。
RTCIceServer:表示一个ICE Server。
Peer-to-peer Data API
DataChannel:数据通道( DataChannel)接口表示一个在两个节点之间的双向的数据通道 。
(3)
WebRTC Native C++ API
本地C++ API层,使
浏览器
厂商容易实现WebRTC标准的Web API,抽象地对数字信号过程进行处理。
(4)
Transport / Session
传输/会话层
会话层组件采用了libjingle库的部分组件实现,无须使用xmpp/jingle协议
a. RTP Stack协议栈
Real Time Protocol
b. STUN/ICE
可以通过STUN和ICE组件来建立不同类型网络间的呼叫连接。
c. Session Management
一个抽象的会话层,提供会话建立和管理功能。该层协议留给应用开发者自定义实现。
(5)
VoiceEngine
音频引擎是包含一系列音频多媒体处理的框架,包括从
视频采集卡
到
网络传输
端等整个解决方案。
PS:VoiceEngine是WebRTC极具价值的技术之一,是Google收购GIPS公司后开源的。在VoIP上,技术业界领先,后面的文章会详细了解
a. iSAC
Internet Speech Audio Codec
针对VoIP和
音频流
的宽带和超宽带音频编解码器,是WebRTC音频引擎的默认的编解码器
采样频率:16khz,24khz,32khz;(默认为16khz)
自适应速率为10kbit/s ~ 52kbit/;
自适应包大小:30~60ms;
算法延时:frame + 3ms
b.
iLBC
Internet Low Bitrate Codec
VoIP音频流的窄带语音编解码器
采样频率:8khz;
20ms帧比特率为15.2kbps
30ms帧比特率为13.33kbps
标准由IETF RFC3951和RFC3952定义
c.
NetEQ for Voice
针对音频软件实现的语音信号处理元件
NetEQ算法:自适应抖动控制算法以及语音包丢失隐藏算法。使其能够快速且高解析度地适应不断变化的网络环境,确保音质优美且缓冲延迟最小。
是GIPS公司独步天下的技术,能够有效的处理由于
网络抖动
和语音包丢失时候对语音质量产生的影响。
PS:NetEQ 也是WebRTC中一个极具价值的技术,对于提高VoIP质量有明显效果,加以AEC\NR\AGC等模块集成使用,效果更好。
d.
Acoustic Echo Canceler (AEC)
回声消除器是一个基于软件的信号处理元件,能实时的去除mic采集到的回声。
e.
Noise Reduction (NR)
噪声抑制也是一个基于软件的信号处理元件,用于消除与相关VoIP的某些类型的背景噪声(嘶嘶声,风扇噪音等等… …)
(6)
VideoEngine
WebRTC
视频处理引擎
VideoEngine是包含一系列视频处理的整体框架,从摄像头采集视频到视频信息
网络传输
再到视频显示整个完整过程的解决方案。
a. VP8
视频图像
编解码器
,是WebRTC视频引擎的默认的编解码器
VP8适合实时通信应用场景,因为它主要是针对低延时而设计的
编解码器
。
PS:VPx
编解码器
是Google收购ON2公司后开源的,VPx现在是WebM项目的一部分,而WebM项目是Google致力于推动的HTML5标准之一
b. Video Jitter Buffer
视频抖动缓冲器,可以降低由于视频抖动和视频信息包丢失带来的不良影响。
c. Image enhancements
图像质量增强模块
对网络摄像头采集到的
图像
进行处理,包括明暗度检测、颜色增强、降噪处理等功能,用来提升
视频质量
。
编辑本段
相关
谷歌2011年6月3日宣布向开发人员开放WebRTC架构的
源代码
。这个
源代码
将根据没有专利费的BSD(
伯克利
软件发布)式的许可证向用户提供。[5]目前,开发人员可访问并获取WebRTC的
源代码
、规格说明和工具等。[1]
编辑本段
分析
视频
WebRTC的视频部分,包含
采集
、编解码(I420/VP8)、
加密
、媒体文件、
图像处理
、显示、
网络传输
与流控(
RTP/RTCP
)等功能。
视频采集
---video_capture
源代码
在webrtc\modules\video_capture\main目录下,包含接口和各个平台的源代码。
在windows平台上,WebRTC采用的是dshow技术,来实现枚举视频的设备信息和视频数据的采集,这意味着可以支持大多数的
视频采集
设备;对那些需要单独驱动程序的
视频采集卡
(比如
海康
高清卡)就无能为力了。
视频采集
支持多种媒体类型,比如I420、YUY2、RGB、UYUY等,并可以进行帧大小和
帧率
控制。
视频编解码---video_coding
源代码在webrtc\modules\video_coding目录下。
WebRTC采用I420/VP8编解码技术。
VP8
是google收购ON2后的开源实现,并且也用在
WebM
项目中。VP8能以更少的数据提供更高质量的视频,特别适合视频会议这样的需求。
视频加密--video_engine_encryption
视频加密是WebRTC的video_engine一部分,相当于视频应用层面的功能,给
点对点
的视频双方提供了数据上的安全保证,可以防止在Web上视频数据的泄漏。
视频加密在发送端和接收端进行加解密视频数据,
密钥
由视频双方协商,代价是会影响视频数据处理的性能;也可以不使用视频加密功能,这样在性能上会好些。
视频加密的数据源可能是原始的
数据流
,也可能是编码后的数据流。估计是编码后的数据流,这样加密代价会小一些,需要进一步研究。
视频媒体文件--media_file
源代码在webrtc\modules\media_file目录下。
该功能是可以用本地文件作为视频源,有点类似
虚拟摄像头
的功能;支持的格式有
Avi
。
另外,WebRTC还可以录制音视频到本地文件,比较实用的功能。
视频
图像处理--video_processing
源代码在webrtc\modules\video_processing目录下。
视频
图像处理
针对每一帧的图像进行处理,包括明暗度检测、颜色增强、降噪处理等功能,用来提升视频质量。
视频显示--video_render
源代码在webrtc\modules\video_render目录下。
在windows平台,WebRTC采用direct3d9和directdraw的方式来显示视频,只能这样,必须这样。
网络传输
与流控
对于
网络视频
来讲,数据的传输与控制是
核心价值
。WebRTC采用的是成熟的RTP/RTCP技术。
音频
WebRTC的音频部分,包含设备、编解码(iLIBC/iSAC/G722/PCM16/RED/AVT、NetEQ)、加密、声音文件、声音处理、声音输出、音量控制、音视频同步、
网络传输
与流控(RTP/RTCP)等功能。
音频设备---audio_device
源代码在webrtc\modules\audio_device\main目录下,包含接口和各个平台的源代码。
在windows平台上,WebRTC采用的是Windows Core Audio和Windows Wave技术来管理音频设备,还提供了一个
混音
管理器。
利用
音频设备
,可以实现声音输出,音量控制等功能。
音频编解码---audio_coding
源代码在webrtc\modules\audio_coding目录下。
WebRTC采用iLIBC/iSAC/G722/PCM16/RED/AVT编解码技术。
WebRTC还提供NetEQ功能---抖动缓冲器及丢包补偿模块,能够提高音质,并把延迟减至最小。
另外一个核心功能是基于语音会议的
混音
处理。
声音加密--voice_engine_encryption
和视频一样,WebRTC也提供声音加密功能。
声音文件
该功能是可以用本地文件作为音频源,支持的格式有Pcm和Wav。
同样,WebRTC也可以录制音频到本地文件。
声音处理--audio_processing
源代码在webrtc\modules\audio_processing目录下。
声音处理针对音频数据进行处理,包括回声消除(AEC)、AECM(AEC Mobile)、自动增益(AGC)、
降噪
(NS)、静音检测(VAD)处理等功能,用来提升声音质量。
网络传输与流控
和视频一样,WebRTC采用的是成熟的RTP/RTCP技术。
参考资料
1.
谷歌开放实时通信框架WebRTC源代码
.
2.
WebRTC架构分析
.CSDN.2012-05-03[引用日期2012-05-30].
3.
WebRTC Architecture
.
http://www.webrtc.org
.2011-4-30[引用日期2012-05-30].
4.
WebRTC 1.0: Real-time Communication Between Browsers 协议文档中文版
.iwebrtc.2012-10-17[引用日期2012-10-17].
5.
谷歌开放WebRTC音视频聊天技术源代码
.
通信人家园 (https://www.txrjy.com/)
Powered by C114