第二十二届高交会中国高新技术论坛开幕论坛
时间:2020年11月11日10:30—11:40
地点:深圳会展中心5楼簕杜鹃厅
主持人:艾学峰(高交会组委会副主任兼秘书长、深圳市副市长)
艾学峰 高交会组委会副主任兼秘书长、深圳市副市长
实录内容:
艾学峰:尊敬的各位领导、各位来宾,女士们、先生们,大家上午好!今天我们非常荣幸地邀请到中国工程院院士以及国内高科技企业的嘉宾出席开幕论坛并发表精彩演讲。在此,我谨代表高交会组委会和深圳市委、市政府对各位嘉宾的到来表示热烈的欢迎和衷心的感谢!
高交会为深圳主动融入全球科技创新网络提供了重要平台,为中国的高新技术领域对外开放提供了重要窗口,为推进国际科技经济交流合作架设了桥梁。本届高交会以“科技改变生活 创新驱动发展”为主题,全面展示我国深入实施创新驱动发展战略,落实粤港澳大湾区发展战略,建设现代化经济体系的最新成果。今天,各位嘉宾齐聚一堂,将围绕科技创新、发展共赢以及后疫情时代的新发展格局发表真知灼见,共同探讨未来的发展。现在,论坛演讲正式开始,我们将首先邀请中国工程院院士邬贺铨先生。邬贺铨先生长期从事数字和光通信系统研究开发工作,1999年当选为中国工程院院士,从2003年以来先后作为国家下一代互联网示范工程专家委主任组织IPV6项目研究实验,作为新一代无线宽带移动通信科技重大专项总师,组织3G、4G、5G项目研究开发,近年来负责组织重大工程科技咨询项目研究。今天他演讲的主题是《“十四五”时期的互联网技术》,下面有请邬贺铨先生演讲,大家欢迎!
邬贺铨 中国工程院院士
邬贺铨:尊敬的艾市长、各位专家、各位来宾,早上好!很高兴来参加高交会开幕论坛,我的报告题目是《“十四五”时期的互联网技术》。
从第一次科技革命1687年开始,到1915年爱因斯坦提出相对论开始第二次科技革命。这中间对应着三次工业革命,第一次工业革命是机械化为代表,第二次工业革命是电气化为代表,第三次工业革命是信息化。信息化对应的技术,现在是实时通信技术。为什么从1990年算起呢?这时候是互联网进行商用,也是中国全功能接入互联网的时候。大家关心的是现在信息化能持续多久,按照前面的是100年,所以推测信息化可能会延续到本世纪,当然不仅仅是信息通信,也许会信息跟生物技术结合。科技革命带动经济的变化,我们从农业经济走向工业经济,现在是数字经济,实际上也是工业经济时代的特征。
新技术首先从摩尔定律集成电路开始,集成电路经过这么多年的发展和技术进步,集成电路基本上还是沿着摩尔定律发展,集成电路器件包括晶体管数密度的变化,我们以华为5G手机为例,2018年9月是麒麟780,2019年9月是麒麟990,今年9月是麒麟9000,在5纳米的工艺上每平方毫米有1.71亿个晶体管。我认为集成电路的技术进步在4G之前是计算机驱动的,5G极大引领了集成电路工艺技术的进步。如果说今年手机已经进入了5纳米,到2025年有可能会用1纳米的。目前CPU的能力已经做到跟老鼠脑子的水平差不多,有望2030年达到人脑的水平。
全球超算50强,前三名是日本、美国,中国排第四、第五,但是在全球500强里面,中国占了45%,是最多的。计算能力还需要有很大发展,从2012年到2019年,人工智能所需要的计算能力增长了30万倍,但是并不一定都要由超算来计算人工智能,人工智能目前神经网络并不需要那么高的精度和指令集,也许专为人工智能设计专用计算机比通用的更有效。
人工智能的算法目前还是基于深度神经网络,分出来是什么东西机器不见得是知道什么东西,这时候要人告诉它,这叫有监督学习。当然如果进来的带有文字,也许不需要人告诉它,它就知道分类是什么。经过分完类,我们可以进行测试。猫、狗这些是很形象的,工业上用收集的数据不能眼睛一看就知道是什么,必须要标注和清洗。
人工智能的发展,第一代还是基于专家系统靠推理,第二代主要是靠数据驱动做感知,都还有片面性,未来需要有知识与数据的融合,要解决现在人工智能稳定性、可解释性还不够的问题。
所有网络发展都需要通信,现在以光纤为例,单波长可以支持多个信道,另外可以波分负用,还可以有X偏振、Y偏振,还有载波复用,光的技术也在不断演进。原来单膜光纤只传一个膜,现在利用信号处理技术,一根光纤可以传出多膜,也就相当于当几根光纤使用。我们通过多重维度提高光纤的容量,并且光网络技术也在发展,光接入技术也在从普通的拨号上网到ADSL到现在的百G-PON,5G也会对传输技术提出新的要求。总之,单光纤的容量20年提高了1万倍。未来干线的单波长可以做到T比特,单纤可以做到P比特,长距离也能做到100T,到目前为止还没有把光纤理论上的容量能够达到,还有一个很大的空间。
我们走过的第一代移动通信是模拟的,蜂窝小区依靠频率的不同区分用户。2G是数字的,它靠时序的不同区分用户,3G是以码道的不同区分用户,4G把频率和码道几重因素用上去,4G可以做到峰值速率100M,5G的多址方式是4G的改进,峰值继续提升。这里面相同的是它们都是十年一代,每一代峰值速率提高了1000倍。以5G为例,它主要还是依据通信的香浓定理,首先把基站做得更密、把天线做得更多、把频率展得更宽、物理层的改进,做到了增强移动宽带高可靠、低时延长、广覆盖、大联接。同时还要利用网络技术,云化、虚拟化、软件定义、网络切片,使得5G和4G比在多项性能上有1-2个数量级的提升。但是5G毕竟是无线传输技术,为什么会起这么大的作用呢?是因为它高宽带、高可靠、低时延、大联接。它把云计算、大数据、人工智能、物联网、区块链、工业互联网紧密地融合在一起,打通了数据从采集、处理、分析、决策的全过程,发挥了数据作为生产要素的作用,所以它是集成了新一代信息技术,当然未来还会往6G进一步发展。
我们再看互联网。互联网到现在有50余年的历史,前50年基本上是美国国防部的网络和科学基金委的网络,更多是为学术研究用。从90年代开始互联网商用,这十几年时间互联网基本上中外出现了一大批互联网企业。现在进入了移动互联网时代,人工智能、大数据这些技术也凸显。随着5G的商用,工业互联网、可信互联网和价值互联网。
业界一直在探讨网络新的颠覆性的技术,但是应该说现在还没有可信的、可用的技术,现在回过头来看IPV6,我们现在把地址更进一步利用,传统的IP地址不知道IP包上承载什么业务,现在我们在IPV6上定义IP包,用户的身份,APP的身份,业务的需求,对信道带宽、抖动、时延、丢包率有什么要求,就可以知道是什么业务,可以针对性服务。现在我们在IPV6里面,根据传输过程中的误码发现丢包率,并且加入时间标签可以发现传送的延时。我们还通过分段陆游,比如我们计算出这个路由,然后下发给第一个路由器,在第一个路由器得到IPV6的指令,中间的路由器就没必要进行思考了,直接可以建立一条路由。一旦里出了故障马上上报重新修改这个路由。可以实现快速倒换,可以预先针对故障应该往哪倒,甚至可以为同一个人的同一个目的地的业务,我们可以同时安排4条路由,这样保证高可靠。而且通过软件定义,我们可以区别正常选这条路,如果要求低时延可以给你选低时延的路,如果你需要高带宽可以给你选高带宽的路。IPV6使得网络可以更能感知网络,更能提供有针对性的服务。
5G毕竟还驱动了物联网的发展,2016年通过了窄带物联网的国际标准,现在5G实现了高宽带、大连接并且智能联网。什么叫智能联网?我们甚至可以把人工智能的芯片、人工智能的操作系统嵌入到物联网终端,这样就组成一个前端具有智能处理的物联网终端智联网。更进一步我们可以把区块链也嵌入到物联网上。未来不单是上网上云上链,不仅是网络互联,数据互联,价值互联,我们从物联网发展到智联网、信联网,从万物互联到万物智联,到万物信联。
5G的出现使得我们的计算能力分配有很大的不一样,一种是终端计算验算,云端的迁移,终端不需要赋予那么大的计算能力,通过5G网络,高带宽、高可靠,第一时间获得云端的能力,所以终端可以简化,即插即用。另外一种是把云端的能力一部分下沉到边缘云,这样便于实时性处理那些对时延敏感的业务。云边端都有计算能力,需要很好的协同。比如城市视频有很大的摄像头,前端摄像头做视频编码,边缘计算做特征提取,中心云做联合优化。我们现在推动的虚拟现实的沉浸式运用,手机做视频全景编码,边缘计算做全景压缩,中心云做背景渲染,这样把各方面的能力充分调动。现在工业互联网会成为互联网发展的主场,工业互联网连接海量的数据,通过工业互联网平台支持各种APP的应用。平台里面包括了边缘层以及IaaS,这里面有各种各样的基础设施。更重要的是PaaS层,以及SaaS提供工控软件和工业APP,估计到2025年工业PaaS有望标准化。“十四五”还会有更大的发展,虽然现在5G商用了,但还有很多我们意想不到的东西。
我们回顾一下历史,2G是1991年商用的,中国是1994年开始的,1992年有了短信,2003年有了手机QQ,2004年有了支付宝。3G是2001年商用的,中国是2007年开始使用的,3G出现以后有了智能手机、移动电子商务、微博、美团、微信,中国的微信是在3G商用4年以后才出现的,可以说在3G商用之初我们根本不知道会有这些东西。4G是2010年商用的,中国是2013年开始的,得益于宽带能力,4G之后有了支付宝、网约车、拼多多、头条、快手、抖音,这些也是4G商用之初没有想到的。中国的5G跟发达国家同步,得益于云端智能融合能力,可以支撑超清视频、虚拟现实、智联网、工业互联网、车联网,但这些就是5G的全部吗?不是的,移动通信新业态是网络能力具备以后催生的,5G一定会催生出现在还想象不到的新应用。我们说5G会渗透到各行各业,我们可以回顾2G网上银行,3G出现手机银行,4G有数字银行,5G将来会推动智慧银行。整个数字经济会有更多的新技术、新模式、新业态出现。
5G有机构预测,2035年会增加13.2万亿美元产出,对应的GDP增加是7%,对应的全球是3.6万亿美元,中国是1.1万亿美元。麦肯锡预测,2030年AI为全球GDP增加1.2个百分点,经济增加13万亿美元。埃森哲预测2035年AI使全球利润率提高38%,相当于经济增长14万亿美元。埃森哲预测,到2030年,工业互联网能为全球经济带来14.2万亿美元的经济增长。我们说人工智能、5G、工业互联网三者,有些是2030年,有些是2035年,我们保守点都算到2035年,这三者之间会有一些重叠,可以预计到2035年人工智能、5G、工业互联网使全球经济增加40万亿美元。中国信通院做了对国内数字经济的预测,去年数字产业化技术的直接贡献占GDP的7.2%,产业数字化这些技术在传统领域里面的附加值占GDP的29%,两者加起来超过了GDP的1/3。
我们现在处于信息技术的时代,还将持续一个很长的周期,“十四五”仍然是信息技术发展的黄金时期。在“十四五”,5G与IPV6、光纤通信、云计算、物联网、大数据、人工智能、区块链等新一信息技术融合,并与产业技术深度融合,腾云驾雾融智赋能。互联网作为通用技术也将通过数字化、网络化、智能化服务于其他高新技术及产业的发展。互联网将从面向消费应用深化拓展到面向产业应用,加快数字化转型的渗透,促进数字经济发展。互联网从用户普及率来看难以高速增长,但面向物的连接数将多于面向人的连接数。互联网形成的创新生态还会释放更大的创新潜力,新模式、新业态、新应用将会不断地涌现。谢谢大家。
艾学峰:谢谢邬贺铨院士的精彩分享,接下来我们将邀请中国工程院院士、鹏城实验室主任高文先生。高文先生先后主持973、863、国家自然科学基金等国家级项目20余项,以第一完成人先后6次获得国家科技进步二等奖和国家技术发明二等奖。今天,他演讲的主题是《鹏城云脑开源生态》,下面有请高文先生演讲,大家欢迎!
高 文 中国工程院院士、鹏城实验室主任
高文:各位领导、各位嘉宾,大家上午好!刚才邬院士给大家送上了一顿大餐,我怕大家消化不良,别讲得太快,把刚才邬院士讲的很多非常有价值的东西很快就冲淡掉了,所以我尽量慢点说,把不重要的事就跳过去。
今天我为大家讲的是关于鹏城实验室与鹏城云脑。鹏城实验室是2018年3月份在深圳成立的一个广东省实验室,当时广东省设定这个实验室的动机是要培育一批国家实验室的种子队,鹏城实验室就被作为种子队当中的种子,而且是最大的一颗种子。设立这个实验室的时候,我们工作的领域在信息通信,特别是通信与人工智能这个领域。当然我们现在是不辱使命,已经完成了省里和深圳市交给我们的任务,现在国家给我们设定的研究领域用三个主题词来说就是网络、通信、智能。这个实验室从成立一开始,我们做了很多探索,一个最重要的探索就是我们采用双轮驱动模式,一只轮子是项目驱动,就是设定了一些以国家重大需求为研究目标的一批重大项目;另外一只轮子是自由探索,我们采用院士工作室制度,我们选定一些在这个领域里面相对年轻比较活跃的院士,每年给他们1000万人民币,让他们做自由探索,而且这个自由探索不像其他地方给钱要申请,要评审,最后通过不通过还要砍掉多少钱,我们全都没有,我们就信院士了,一千万都是你说了算,你只要不违反规定,你想雇谁就雇谁,你想怎么花怎么花,你想干什么干什么,你每年要写一个工作计划,这个工作计划报到我们,我们阅,然后就放到抽屉里。这不是说没用,有用,我们到年底的时候会拿出来跟院士对照一下,你年初是这样想的,你今年一年下来和年初想的一样不一样。
我们现在完成了作为种子队的历史使命,国家给我们的任务是让我们在通信、网络、智能三个方向上展开研究,所以我们自己设定了一个使命与愿景,三句话把我们的使命和愿景表达得比较清楚。第一句话是“交流无障碍”,这是指通信,通信是指人和人、人和机器、机器和机器之间能够实现通信,它最高的境界就是交流无障碍,这个可以解释任何东西,协议上无障碍、带宽上无障碍、语言种类无障碍、交流无障碍。第二句话叫“连接无极限”,网络就是做连接用的,可能是终端和终端的连接,终端和设备之间的连接,人和终端之间的连接,或者是一些具有物理地址的终端和其他任何一个有地址的终端之间的连接。我们说连接无极限就证明不管你在什么特定的网络条件下,不管你采用什么命名机制,不管你用什么协议都能连到一起进行通信。第三句话叫“进化无止境”,现在人工智能无非就是想把人具有的智能用机器给模拟仿真出来,甚至要比人更强一些。这是要通过机器学习的办法,不停地让计算机、机器人对智能的仿真要做得越来越好,要不停地进化、不停地迭代。我们说进化无止境,就怕你想不到,没有做不到。
鹏城实验室作为一个能够支撑国家重大任务研究的研究机构,它的能力在哪方面体现?可能有的人说你要有最好的园区,有最好的研究大楼,是吗?是,也不是。有的人说你要有最好的研究人员?是吗?是,也不是。有的人说你要有最好的研究设施、研究平台,让国内甚至国际上最好的人能到你这里来研究?是吗?是。我们最重要的任务是要做平台。刚才说我们有三个特定的方向,在三个特定的方向上,鹏城云脑就是为智能这条线所提供的平台。
鹏城云脑是我们刚才说的进化无止境这里面最重要的一个基础设施,你想做智能的演进,你想做模型的训练,你就需要有非常好的装置。我们知道学校里面的研究生和老师辛辛苦苦申请到了几十万、几百万的经费,买几个GPU的卡,性能好一点的几万块钱,再买好一点的十几万块钱,可能买几块性能好的卡构成经费就没了。这些钱从哪里来?学校是花不起的,公司花得起,但公司有它的商业诉求,它不可能把这个东西开放给真正做研究的人去用,开放给那么多投入的人去用,是不可能的。怎么办呢?我们来提供。所以要想进化无止境,对于研究群体或中国的研究社区来说,需要一个智能的基础设施,鹏城云脑就是我们想提供出来的基础设施。
为什么需要建这个鹏城云脑呢?前期我们一开始有这个想法的时候,包括跟地方领导,包括跟省里、市里的,包括跟发改委领导汇报这个项目的时候,他们的第一个问题是现在国家已经建了这么多超算中心,深圳有超算中心,广州有超算中心,上海有、天津有、无锡有,国家有那么多超级计算机中心,为什么你还要做一个?后面我们告诉他们说,传统的超算做人工智能的训练效率太低。前两天我们工程院有一位领导专门写了一篇文章,说你要用传统超算做人工智能的训练,它的效率是比较低的,大概是多少呢?AI算力275分之一,现在超算的峰值速度,做人工智能的工作要除以275,这才是真正的性能。这就等于你用一只很大的马拉一个极小的车,那真是资源的浪费、能源的浪费、算力的浪费。怎么办呢?我们要做一个专门面向人工智能的装置,我们把这个叫做AI超算或AI超级计算,我们在这叫鹏城云脑。现在做机器学习,做深度神经网络的训练,它里面用的架构和传统的解方程是完全不同的架构,所以必须要能适应这种新架构的方式,所以现在的人工智能超算是专门为了机器学习,为了训练深度网络所设计的一台机器。
我们想清楚了以后就要开始做,从2018年鹏城实验室一成立的时候,我们就下决心要做鹏城云脑,当时我们提出了鹏城云脑I的目标,那时候我们考察了国内国外所有可能的解决方案,我们最后决定要选择英伟达的GPU作为我们鹏城云脑I的主力计算单元。当然不光是英伟达的芯片,当时我们设计里面也包括有寒武纪的芯片,也包括谷歌的芯片,当时我们设定了若干个芯片。但现在实际上运行最好的还是英伟达的机器,所以现在鹏城云脑I已经有100P的算力,这个算力是多强呢?1亿是10的8次方,亿亿是10的16次方,100亿亿是10的18次方,2021年世界上最强的超算会是100亿亿这么大的算力。鹏城云脑已经是100P,100P是多少呢?10的17次方。当时我们把英伟达的机器装好了以后发现这个机器还还是只能玩点中小型的训练,真正做大型的训练还是不行,做不了,怎么办呢?我们就下定决心设计鹏城云脑II,这个机器从开始启动论证到最后装机完成,深圳经济特区建立40周年采访王伟中书记的时候有一个对话节目,在上面我说了几句话,最后央视也采用播出来了,深圳速度,这台机器鹏城云脑II,从开始启动论证到最后装机完成9个月,这在以往任何大型的科学设施建设过程中是不可想象的一件事,通常是7-10年,我们是9个月。花了多少钱呢?42亿。一般发改委批的一个大科学装置就十几亿,我们是42亿,9个月就把这个机器做出来了。这个机器是1000P,也就是100亿亿次,我们的AI算力是100亿亿次,如果超算的算力要想做AI的时候和我们一样的算力怎么办呢?要在这个基础上再乘上275,那可能若干年后才能达到这个速度。所以从AI算力来讲,它的能力已经是世界最强的一个机器了。这台机器采用的是华为的核心芯片NPU,专门面向深度学习的处理芯片,用这个芯片构造的人工智能节点,人工智能节点一共有1024个,华为原来做的阿特拉斯900AI服务器,我们用的是类似于从硬件资源,相当于是4个阿特拉斯900服务器的构架,但是整个网络结构里面的硬件配置都做了很大的调整和改变,所以它的性能是非常好的。这台机器在10月22日已经满负荷运行了。
这台机器除了峰值指标在AI选择方面是最强,有没有也要参加全球Top500比赛呢?我们已经提交了测试的数据上去,大概在今年11月下旬就会知道我们能不能排到第一。其中有一个赛道是IO500,就是输入、输出排名世界前500,我们现在的成绩比上一次的成绩是多少呢?上次IO500排第一的得分是1700分,我们这次提交的成绩是多少呢?7000分。按照以往的经验,我们这个至少可以两年排第一,当然因为现在技术进化很快,我们要等揭榜那一天才知道排第几。人工智能训练最重要的是要有数据大吞吐进和出的能力,进的是训练数据,出的是训练参数,吞吐要非常大,IO就是负责这方面的,这个排在最前面,说明做人工智能训练的能力是最强的。
有了机器,我们要把机器用好,除了硬的之外,我们在上面设计了软的东西,同时配套了联盟、社区、开源的各种各样活动比赛来支持个硬件发挥它在人工智能里面的作用。比如我们可以用它做云脑大数据模型训练,通过数据上传、模型训练等适配,最后可以启动应用。16万个AI科研训练任务目前主要是在鹏城云脑I上完成的,因为这是完全免费的,向全国开放的,鹏城云脑II上来以后训练任务至少在这后面加一个零。我们用这个装置,现在在深圳已经进行了关于智慧城市,特别是交通数据的实时智能处理典型案例的实现,用了这套系统以后,在光明区那个地方检验的结果,平均汽车行驶时间可以缩短15.7%,通过训练调整信号灯的控制。
为了把这个机器做得更好,我们在科技部下面成立了新一代人工智能产业技术联盟,希望打造一个国家级的开源开放基础平台,这个联盟里面有15个国家级的开放平台,比如第一批的科大讯飞、百度、腾讯、商汤等。第二批去年又有10家,这15家是国家的开源开放平台,在上面构建若干个池,提供最好的开源生态。新一代人工智能开源开放平台,我们采用一体两翼,左翼是以技术专家为主体组成的多个工作组,右翼是以企业为主体的应用推进组。在开源生态里面有三个板块来推动开源的发展,一个是精品店,目前主要是5个国家级的开放平台,以后我们会发现很多东西也会推到精品店。私房菜是在特定领域做得比较好,比较成熟的可以直接拿去稍微调整就可以使用的方案。大集市是通过这个社区大家可以在那里自由讨论、自由买卖、自由观摩。精品店主要是以15个国家开放平台,今后会加上做得比较好的东西,经过测试是完全可以快速应用的,我们就推了精品店。除了这三个板块以外,我们对特定的应用领域也予以关注,比如我们对开源芯片平台特别关注,主要是基于RISC-V处理器,我们会专门提供一个开源SOC芯片平台这样的开源项目来支持它。大集市,我们不光让大家在这上面可以自由展示你的东西,同时我们还提供一个比较好的托管平台,现在一般的开源托管平台是放在GitHub上,现在有很多担心说万一中美关系再恶化大家就不能访问那个网站,中国的人工智能就没有办法发展了,我们就提供了国内的iHub的平台供大家使用。我们组织人工智能大赛提升社区的认可度,以及奖励那些做得好的,从前年开始,全国人工智能大赛在深圳是一个很大的活动,每次都是市长亲自挂帅做总牵头,奖励很丰厚,比如一等奖是100万,二等奖是50万,所以参赛的队伍很踊跃,去年有4000支队伍,今年有6000支队伍。这就是关于鹏城实验室和鹏城云脑,如果大家对我讲的内容感兴趣,欢迎大家跟我们联系,谢谢大家!
艾学峰:女士们、先生们、朋友们,今天我们有幸聆听到各位科技领域专家的精彩分享,共同展望了科技创新对我们生活和社会发展带来的变革,使我们对科学技术领域的创新发展有了新的收获。最后,让我们再次以热烈的掌声对今天的演讲嘉宾表示衷心的感谢!论坛到此结束,谢谢大家!