腾讯云副总裁吴祖榕:一个为5万日活设计的系统,两个月内如何扛下千万日活

“作为原来只为5万DAU设计的系统,短短两个月时间内快速扩容、调整架构,快速支撑超过千万日活跃用户”, 12月19日,在腾讯2020 Techo Park开发者大会上,腾讯云副总裁、腾讯会议负责人吴祖榕表示。

作为一款去年底刚发布的视频会议产品,腾讯会议诞生2个月日活跃用户就超过1000万,发布245天用户数突破1亿,成为中国最多人使用的专业视频会议产品,这背后是整个腾讯云提供的技术演进和保障。

(腾讯云副总裁、腾讯会议负责人吴祖榕)

吴祖榕表示,过去20年时间里腾讯一直非常坚定的在通信技术上做了大量的投入,背后技术演进的路线最早可以追溯到QQ时代,早期的QQ音视频技术到后来推到腾讯云上,在云端提供各种各样的视频解决方案,基于这种视频解决方案才推出了腾讯会议。

谈及腾讯会议的演进路径,吴祖榕透露在产品孵化期只投了1.5个后台开发,花了两个月时间完成了整个腾讯会议的后台体系搭建,背后的核心技术就来自于腾讯云原生一系列的技术组件,包括基础设施、比如存储层、逻辑层、接入层,大量快速的使用这些基础设施,极大的降低了后端的开销,使得我们后台开发人员只需要关注我们的业务逻辑,保障整个业务的推出,正因为我们在早期充分使用了一系列云原生的组件,后续的扩容方便就得益于此。

“先扛住,再优化”,面对疫情期间庞大的用户基数和并发量,腾讯会议迎来了日以继夜的扩容,背后涉及到非常复杂的调度,因为腾讯云储存了大量的弹性资源,使得腾讯会议可以使用到腾讯云的IP资源、技术资源、带宽资源,一系列的资源都在为业务给予足够的保障。于是,才有了腾讯会议8天扩容10万台云主机,创造了中国云计算的历史记录。

如今,随着腾讯会议的业务步入稳定期,功能、安全、迭代升级变得越来越重要。腾讯会议也到了可以反哺开发者的时候,提供API和SDK,未来所有开发者可以在官网上申请使用,快速构建起多人通信的能力。同时腾讯会议已经和多家硬件厂商合作,推出会议室连接器和腾讯会议Rooms,希望提供更好的软硬一体的解决方案。

以下为腾讯云副总裁、腾讯会议负责人吴祖榕演讲全文:

各位开发者,大家好!我是来自腾讯会议的吴祖榕,很高兴在这里跟大家分享腾讯会议在过去一年的研发历程以及我们所经历的整个过程,我的题目是叫做“生于云、成长于云”,这是腾讯会议一年时间里迅速成长的原因,但回顾以往,我觉得更是得益于多年以前我们最坚定的投入,在今天换来的回报。

腾讯会议是在去年12月25日发布的,那个时候我们给自己定小小的目标是,希望年底的时候我们的DAU可以到5万,就是一天有5万个活跃用户,我们觉得这是我们今年最好的成绩,但是一场突如其来的疫情使得我们在不到两个月的时间里这个目标翻了几百倍,作为原来只为5万DAU设计的系统,我们怎么保证短短两个月时间内快速的扩容、调整整个架构,才能配合我们的客户端,快速地支撑过千万的用户。

大家觉得说腾讯会议是去年年底才推出的,但腾讯会议的积累绝不是刚刚起步。过去20多年时间里,腾讯一直非常坚定的在通信技术上做了大量的投入,所以背后技术演进的路线最早可以追溯到QQ时代,早期的QQ音视频技术,到后来QQ的音视频技术推到腾讯云上,在云端提供了各种各样的视频解决方案,基于这种视频解决方案我们推出了腾讯会议,沿着实时音视频的技术链路,腾讯耕耘了超过20年的时间。

我们大概看一看整个腾讯会议在过去一段时间的历程,简单的分成三个阶段:

第一个阶段,来自孵化期。那时候我们要把最小的功能单元做出来,最大的压力可能来自于团队规模很小,最早的一个版本,整个腾讯会议的开发团队加起来可能就7.5个人,到了真正的爆发期我们发现用户海量的增长,如何提供最稳定的服务是最重要的事情。等到疫情受到控制的时候,我们如何结合用户的实际需求提升我们的服务质量,把安全相关的工作做到极致,这就是我们在这个阶段上面临的挑战,我简单的阐述一下每个阶段我们重点的工作。

我们可以看到在孵化期只投了1.5个后台开发,花了两个月时间就完成了整个腾讯会议的后台体系搭建,背后的核心技术就来自于腾讯云原生一系列的技术组件,包括我们的基础设施、比如存储层、逻辑层、接入层,大量快速的使用这些基础设施,极大的降低了我们后端的开销,使得我们后台开发人员只需要关注我们的业务逻辑,保障整个业务的推出,正因为我们在早期充分使用了一系列云原生的组件,后续的扩容方便就得益于此。

第二阶段,等到疫情来的时候我们可以看到,1月23日的时候武汉开始封城,看到这个消息,当时整个团队聚在一起说我们做点什么,于是我们跟公司做一个请示,能不能快速地将面向全行业收费的会议能力放开,于是得到公司快速的肯定马上放,1月24日的时候就在全网放开了,不到3天时间里收到更多的反馈,就觉得100方远远不够,开一个普通内部沟通会议都要两三百人,于是这个时候我们做了另外一个重要的决定,我们春节前一个月时间里研发了300方的视频会议能力,我们果断把这个功能也放开了。随着通讯容量的增长,也来了大量用户的涌入,所以短短的时间我们迎来了海量用户的增长。

真正的挑战发生在2月3日,是我们春节假期回来之后第一天,大家开始复工复学的第一天,我们就迎来了日以继夜的扩容,背后涉及到非常复杂的调度,因为腾讯云储存了大量的弹性资源,使得我们大量时间里可以使用到腾讯云的IP资源、技术资源、带宽资源,一系列的资源都在为我们的业务给予足够的保障。也充分体现了我们在扩容过程中基础设施层面提供了大量的保障,这段时间我印象最深得是,腾讯过去讲海量服务“先扛住,再优化”,过去往往周期是一个月、两个月,到了疫情的时候,这个时间缩短到了24小时,白天的时间里我们在做大量的扩容,到了夜里就开始对产品性能、部署中的跟踪等问题,做大量的部署、开发,凌晨的时候我们可能开始对今天所做的所有变更、代码优化做压力测试,这样日以继夜循环了一两周,我们完成了扩容、稳定了后台服务,创造了整个中国云计算的历史。

第三阶段,随着我们的稳定性得到基础保证之后,功能变得越来越重要,我们不仅在后端使用了腾讯云自带的云原生的组件,我们客户端也大量使用了云端的SDK和云PaaS,早期给我们带来非常大便捷性的微信小程序的互通,是基于视频云的解决方案在提供服务,同时我们的直播,使得我们无需在软件中设计IM系统,这样的背景下我们100天时间里迭代20多个版本,快速满足行业需要。

随着国内疫情慢慢得到控制,海外疫情又重新开始发酵、爆发,这个过程中我们又积极部署了我们国际版VooV Meeting,这个过程我们可以看到,也正是基于腾讯云全球的部署,我们通过在全球各个关键节点部署我们的服务器跟我们的服务进程,来保障了整个全球的通信,因为我们知道两点之间直线最短,但是在网络的世界里两点之间并不意味着直线最短,我们希望非常大的调度,比如一个欧洲的客户,他直联中国并不是很好,也许我们中转新加坡、再转香港,这样的调动策略可能使得丢包、抖动大幅度降低,腾讯云部署了非常多节点的大网,这个当中部署充分的路由和调度,使得我们得到极大的体验优化。今天可以看到,我们每天有大量的全球会议在进行,也正是依托于我们这样的全球部署。

于是等到所有的前期的基础建设完成之后,我们也进入了整个产品迭代的稳定期了,整个过程中我想举两个例子跟大家分享,左边是我们一直做的人像分割,疫情期间很多人在家里开会的时候打开摄像头,背后很多实际的画面可能并不适合被摄像头采集掉,所以我们会做虚拟背景,这个虚拟背景最常遇到的问题是什么,

如果你坐个椅子,椅子后面有个靠枕,经常会发现靠枕会时不时的从脑袋后面凸出来,这个感受是非常难受的,所以我们做了大量的采集,同步一个数据给大家,我们大概采集了6万张椅子的数据,6万张带着头枕椅子的数据,通过6万张椅子数据做标注,能够逐步的去影响我们在做虚拟背景的时候后脑部头枕的露出。

在语音方面也依然是会议领域很重要的通信能力,前面还跟大家去讲过,在我们今天腾讯会议还采集了很多噪声,其中有的噪声可能很多人都没想到,我们花了很多力气去采集,雨点打到玻璃窗上的采集,什么样的背景呢?因为有一天我们开会外边下雨,远端的人听着非常嘈杂,他们说发生了什么事情,我们意识到雨点的噪声,随后我们采集了公交车、开门的声音,我们采集了餐桌上吃盒饭的声音、我们采集了关门的声音,几百种噪声我们都在做采集,目的是让我们能够在整个环境中安静地把声音传输给对方,提升我们整体的沟通效率。所以整个阶段,我们围绕“听得清、看得清、听得真、看得真”做了大量的努力。

安全对于通信产品的重要性,便捷性和安全性往往是两个很难彼此平衡的事情,我们如何保持简洁产品体验过程中,依然提供很好的安全体验,就依赖于我们腾讯云整体的智慧安全的体系,每天有非常多的人尝试破解会议号,希望能够闯入别人的会议或者爆破我们的会议链接,一系列爆破过程肯定有特征,我们怎么找到特征拦截用户,这是我们整套体系要做的不仅有业务安全,还有我们的设施安全、线路安全,在两点之间通信的时候整个链路上如何保证他是安全的、不被窃听的,也是依然需要我们投入很大精力努力做的事情。

与此同时,在稳定之后我们要提升我们的产品质量,我们需要非常细化的能够看到每个节点中遇到了什么问题,这张图使用了云原生的组件,今年5月份我们经过这个分析快速找到某个节点中MTU设置有问题,使得我们在通信质量中能够做到实时的跟踪、实时的优化,这对于我们多维分析能力是非常重要的。

前面看到基于腾讯云提供的基础组件做了非常多的云原生的开发、使用,到今天我们觉得腾讯会议也到了可以反哺开发者的时候,我们提供整个API和SDK,未来所有开发者可以在我们官网上申请使用,可以快速构建起多人通信的能力。同时我们和厂商合作,我们推出了腾讯会议的Rooms,希望提供更好的软硬一体的解决方案。

最后我还是特别想感慨的一点就是,我们腾讯会议在最早非常坚定的选择了云原生的开发,才能保证在整个用户大量增长、请求快速增长的时候我们能够真正做到频繁扩容,而整个疫情期间腾讯会议的背后最坚实的力量就来自腾讯云的全力支持。

我的分享就是这些。谢谢大家!

本文链接:http://www.tengxunyun.net.cn/1437.html

上一篇:

下一篇:

document.write(unescape("%3Cspan id='cnzz_stat_icon_1278702005'%3E%3C/span%3E%3Cscript src='https://s4.cnzz.com/stat.php%3Fid%3D1278702005' type='text/javascript'%3E%3C/script%3E"));