腾讯云全新发布音视频技术产品,助力各行业智能化发展

12月20日,腾讯2020 Techo Park开发者大会在北京举行,在主题为“云上视界,对话未来”的视频通信云分论坛上,腾讯云视频业务产品总监黄斌携手多位技术专家共同展示了腾讯在音视频及通信云领域的最新产品及技术进展,成为该论坛一大亮点。

随着音视频在线上会议、教学、商业、娱乐等场景的广泛应用,借助5G、云计算、大数据、人工智能技术,腾讯云构建了一个完整的音视频通信产品体系,覆盖媒体内容生产和音视频通信的各个环节。

首先,腾讯云发布了自研编码器“瑶池V500”和音频技术方案“腾讯天籁”,为提升音视频通信质量输出能力;其次,针对融合通信,腾讯云发布了TRTC在金融及IOT领域的方案,超低延迟“快直播”产品结束公测,正式规模商用;另外,在内容生产方面,腾讯云进一步升级多模态内容制作能力,发布AI媒体内容生产平台智媒,“腾讯云制作”方案在业务能力、素材模版资源及渠道发布能力方面全面升级;最后,“腾讯临境”沉浸式媒体解决方案及对应SaaS平台也在会上正式发布,提供从硬件采集、空间建模、云端SaaS编辑器到终端展示互动的完整一站式能力。除此之外,视频云还发布了视频云海外2.0版本,提升全球服务能力。

首款自研硬件编码器瑶池V500亮相,助力云游戏、超清直播等

随着5G时代的到来,云游戏、4K/8K高清直播等超高清流媒体应用越发增长迅猛,视频编码是决定体验和成本的关键技术。不过,目前市面上的编码器,通常会为了满足实时编码要求,而对编码工具和算法做大量裁剪和简化,最终导致压缩效率低下。

为解决这个痛点,腾讯云首款自研H265硬件编码器瑶池V500把实时编码器的压缩效率提高到了一个新的水平。

腾讯云架构平台部视频研发负责人李雅卿介绍道,在算法上,瑶池V500完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合了腾讯云软件编码器码率控制等方面的领先技术,压缩效率优越;在硬件设计上,通过灵活的多核扩展架构、高性能编码流水线、层级化Memory布局等技术,很好满足了高吞吐、低时延和实时的要求。

项目实测,瑶池V500不仅能够满足手游云游戏体验要求,且在相同画质下相比市面主流方案降低了15%带宽,如果是在相同带宽条件下,对画质的提升效果明显。

除了云游戏之外,腾讯云瑶池V500硬件编码器也适用于高清直播场景。直播场景与云游戏场景不同,直播对延时要求不敏感,因此算法优化空间更大。经实测,瑶池V500在直播场景下压缩效率的优势能提升30%,相同带宽下面画质提升更加明显。

“腾讯天籁”让你“听得见、听得清、听得真”

解决了视频的画面问题,紧接着是声音。腾讯天籁实验室专家研究员肖玮介绍,“腾讯天籁”是腾讯面向实时音视频会议的新一代实时音频技术产品,为了解决实时音视频会议场景下的各种挑战,腾讯天籁以‘听得见、听得清、听得真’为目标,打造了一整套围绕音频通信核心体验的技术体系。

从生活场景体验来看,实时音视频会议面临诸多挑战,如接入设备的差异性、接入场景的复杂化、通话环境的多样化、多人同场地通话、噪声消除,以及网络环境的稳定性等等。

对此,“腾讯天籁”依靠信号处理和深度学习提升声音质量采集上界,同时强化了弱网下的质量保障;相关技术已经在包括腾讯会议的诸多产品中获得应用。例如在声音采集方面,腾讯会议的AI降噪,能够适应多种噪声环境下语音增强任务,提供高质量通话效果;腾讯会议采纳自研的cPLC、cFEC技术,能够在连续120ms突发丢包或者大丢包等场景保持通话连续性。此外,借助本次Techo Park开发者大会,腾讯天籁实验室,也对外发布了《音频联合信源信道编码技术白皮书》。

智媒时代来临,腾讯云AI技术让内容生产更智能

腾讯多媒体实验室总监李松南介绍了AI媒体内容生产平台“智媒”。“智媒”具备自动作词、视频增强、横屏转竖屏、视频剪辑、视频配乐、智能封面等能力,部分功能已开始服务于腾讯云上的明星产品,如腾讯明眸和腾讯智眸。

以视频剪辑为例,利用AI结合多模态,可实现体育、游戏、影视等场景的精彩视频生成。“例如足球视频,我们可以把一场足球比赛按照不同的事件进行拆分,还可以把射门、慢动作、进球等事件拼接起来,自动生成一段针对一场足球比赛的精彩集锦。”李松南介绍道。

此外,AI技术可以识别图片或视频中的人物、动作等信息,自动生成文字描述,当前可完成通用、电商、游戏领域的自动描述,各种领域均可定制。同时还支持自定义语言风格,使其符合标题、摘要、弹幕、解说等各种场景的表达习惯。

腾讯实时音视频TRTC和快直播LEB迭代升级

腾讯实时音视频产品TRTC为开发者提供可快速搭建的低成本、低延时、高品质的互动解决方案,助力企业将线下活动、会议无缝迁移到线上。

据腾讯云终端产品中心高级工程师蒋磊介绍,腾讯实时音视频通信TRTC针对多人互动深度优化,全球端到端延时低于300ms,实测抗丢包率超过 40%,抗网络抖动超过 1000ms,超低延迟大房间支持 10万人在线。

此外,TRTC还采用了腾讯自研的领先行业的实时音频引擎TRAE,具备优秀的3A处理效果,出众的音效处理能力,突出的性能优势,为包括 QQ、微信、全民K歌、QQ音乐 等在内的各类 APP 提供音频底层技术。

随后,蒋磊还展示了“快直播方案LEB”。 据了解,国内传统直播主要采用RTMP、HTTP-FLV、HLS这几种传输协议,一般会出现3~20秒的延时,特殊的场景比如活动赛事直播这种不强调互动性而是要求流畅性的直播延时通常在10秒以上。

腾讯云快直播兼容标准WebRTC并对WebRTC协议进行了多项优化升级,将直播延迟降低至百毫秒级,同时兼顾秒开、卡顿率等核心指标,优化直播体验。不仅如此,快直播兼容目前腾讯云标准直播的全部功能,推流、转码、录制、截图、鉴黄、播放全功能支持,能够满足现有标准直播业务平滑迁移。只需一步即可从标准直播升级到快直播(超低延迟直播),腾讯云快直播现已结束公测期,全面正式商用。

腾讯视频云海外媒体方案2.0发布,云+端一体化、超低延迟、Mediaservice全面上线

面对日益增加的海外媒体服务需求,腾讯视频云海外媒体方案2.0发布。

腾讯视频海外媒体方案2.0主打三大新方向升级:完善“云+端”一体化方案、超低延迟直播全球部署、媒体服务系列新产品Mediaservice全面上线。

目前云+终端一体化解决方案全面上架国际站,极具腾讯云特色的移动直播SDK、短视频SDK、美颜特效SDK全面上线国际站,为海外用户提供“云+端”全链路一体化解决方案。而超低延迟直播(快直播)也已正式在海外上线部署,将为海外客户提供百毫秒级的直播新体验。

媒体服务系列三大新产品(MediaLive MediaPackage MediaConnect)正式在海外上线,能为客户提供极致的转码、封装、全球传输新能力,提供海外OTT场景下的全新解决方案。媒体服务系列新产品覆盖了多种海外常见传输或音视频协议,支持7×24小时极致稳定性能,极速高清智能转码更是最多可达到30%视频压缩率。

此外,腾讯云在全球部署了超过2000个CDN的节点和超过120T的储备带宽,支持RTP/SRT/HLS/DASH等8种海外常见传输或音视频协议支持能力,目前腾讯视频云已经部署全球60多个国家和地区。

腾讯云制作能力全面升级,助力内容创作

腾讯云制作也进行了全面升级,这是腾讯云面向内容制作领域,推出的制作云SaaS产品,为视频内容创作提供了一套“采集-传输-云端导播-视频编辑-剪辑-云端分发”全生命周期解决方案。

此次发布的腾讯云制作产品,提供腾讯独家版权素材库、创意模板库和AI工具箱,除了升级视频剪辑业务功能外,还支持一键分发至企鹅号,新浪微博,快手等媒体平台。

与此同时,腾讯云制作还升级了业务模式,除了0研发投入、0代码接入,2天的急速交付模式让客户低成本且快速拥有自己的整套视频创意网站,上线团队管理模块与行业模板还可提高管理效果和客户使用效果。

腾讯临境打造沉浸式空间体验

腾讯临境为视频云团队针对企业级营销提供的全新一站式沉浸式解决方案,依托多硬件采集支持、空间建模能力、实时通讯/客户呼叫中心等营销能力集成,覆盖客户需要的多样场景,支持多平台终端打造沉浸式新体验。能够助力企业快速实现VR沉浸式营销方式,带给用户全真互联网新体验。

此外本次临境还新发布了临境SaaS平台产品,平台能够为采集完成后的模型轻松叠加营销触达能力,具有操作简单、营销功能全面、模型管理、多平台分发四大特点,让用户的沉浸式营销变得更加简单易用。

例如,国际文博会腾讯VR展厅,打破了时空的限制;“云上滨海”VR展厅使更多人可以参观到腾讯滨海大厦展厅,通过实时VR带看讲解功能,用户可以了解腾讯的文化产业内容和理念。线上参观的方式降低了物质成本,打破了实体展厅人数限制的弊端,可容纳参观人数无上限,“一对多”的互动讲解方式也提升了接待效率。

随着5G、边缘计算等新兴技术的发展,音视频技术正改写电商、教育等行业的发展模式。腾讯云将持续迭代音视频及通信技术,交付高质量、高稳定性及高性价比的技术服务回馈客户与合作伙伴的信任,助力各行业创新发展与变革。

本文链接:http://www.tengxunyun.net.cn/1390.html

上一篇:

下一篇:

document.write(unescape("%3Cspan id='cnzz_stat_icon_1278702005'%3E%3C/span%3E%3Cscript src='https://s4.cnzz.com/stat.php%3Fid%3D1278702005' type='text/javascript'%3E%3C/script%3E"));